シソーラスを用いた派生語の仮名漢字変換の特性(仮名漢字変換・形態素構文解析)
スポンサーリンク
概要
- 論文の詳細を見る
日本語の文章を仮名書きするとセグメンテーションの曖昧性や同音異義語が多発し読みにくい.そのため仮名漢字変換は通常の漢字仮名混じり文の形態素解析よりも難しい問題である.特に派生語には多くの同音異義語が存在するため,変換誤りの大きな原因の1つとなっている.しかし従来の1層の意味分類を用いる手法では十分な正解率を得ることはできなかった.本稿ではPCFGにおいてシソーラス中の様々な階層まで汎化した大量の規則と品詞や単語のレベルの規則とを組み合わせて重み付けすることを試みた.コーパスを用いた実験の結集,学習サンプル数に応じて最適な分類数を選択することによって95%の正解率が得られることがわかった.
- 2004-07-15
著者
-
市丸 夏樹
九州大学システム情報科学研究院
-
中村 貞吾
九州工業大学情報工学部
-
日高 達
九州大学
-
日高 達
九州大学名誉教授
-
日高 達
九州大学工学部電子工学科
-
中村 貞吾
九州工業大学大学院
-
中村 貞吾
九州工業大学
関連論文
- 囲碁の攻合いの数理的解析 : 組合せゲーム理論に基づく手数の評価法(解析,ゲームプログラミング)
- シソーラスを用いた派生語の仮名漢字変換の特性(仮名漢字変換・形態素構文解析)
- 医療論文抄録からのファクト情報抽出を目的とした言語分析
- 語義文からの動詞間の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 語義文からの動詞の上位-下位関係の抽出
- 語義文における動詞間の上位-下位関係
- 確率文節文法とその応用
- ブラケット文法--句構造言語を特性化する文脈自由文法
- 一括処理法による手書き漢字の認識実験
- 手書き漢字の識別実験
- 語義文の機能表現について
- 国語辞典に基づくシソーラスの構築に関する一考察
- 名詞句「NのN」の解析におけるシソーラス知識の利用
- シソーラスと確率文法による派生語解析
- 用例に基づく派生語の確率的解析
- 用例に基づく派生語の確率的解析
- 翻訳文法のための構文解析手法
- 翻訳文法を用いた機械翻訳
- 翻訳文法による機械翻訳とその実装
- 構造化テンプレートを用いた新聞記事からの製品情報抽出
- テンプレートを用いた新聞記事からの製品情報抽出システム
- テンプレートを用いた新聞記事からの製品情報抽出システム
- 共起データに基づく名詞の多次元空間への配置
- 共起データに基づく名詞の多次元空間への配置
- 共起データに基づく名詞のn次元空間への配置
- 係り受け情報を用いた名詞句「NP_1のNP_2」の意味関係の候補の抽出
- 不完全データに対する判別分析と語の共起性推定への応用
- 不完全データに対する判別分析と語の共起性推定への応用
- 共起制約を組み込んだ確率文法による名詞句の統語的曖昧さの解消
- 意味範疇の散らばりに基づいた名詞の統語範疇の分類
- 係り受け文脈自由文法とその日本語への適用
- 係り受け制約を組み込んだPCFGの評価
- 限定頻度を考慮した確率文脈自由文法
- 係リ受け制約の文脈自由文法への組み込み法
- 係り受け制約を含む文脈自由文法
- 係り受け制約を含む文脈自由文法
- 記号表現ベクトル学習機能を有するニューラルネットの英語前置詞句係り先決定問題における実験的評価
- 要約文の話題の流れの最大化による自動要約
- 汎化用例とシソーラスを用いた派生語の仮名漢字変換の特性
- 話題の流れを保持する自動要約(生成・要約)
- 言語コーパスからの語の共起性の推定(自然言語)
- 言語コーパスからの語の共起性の推定
- 汎化された係り受け文脈自由文法の構文解析法
- スパースな学習データにおける確率係り受け文脈自由文法の確率パラメータの推定法
- 確率文節文法による形態素解析実験について
- 情報ハイウェイ時代のテキスト情報への知的アクセス ( 情報処理最前線)
- 文章構造と意味ネットワークを用いた句抽出による文章要約(検索,要約)
- 文章構造と意味ネットワークを用いた句抽出による文章要約(検索,要約)
- 法的事象の論理表現からの法律文生成
- 接続助詞の結合順位に基づく複文の構文解析(構文,係り受け解析)
- 接続助詞の結合順位に基づく複文の構文解析(構文, 係り受け解析)(言語理解とコミュニケーション)
- 接続助詞の結合順位に基づく複文の構文解析
- コンピュータ囲碁(思考ゲーム)
- E-023 口裂周辺の筋電信号を用いた少数語彙世界における黙声単語認識(E分野:自然言語・音声・音楽)
- Q&Aの自動回答支援システム(翻訳,対話)
- 自然言語インターフェースのための無発声音声認識への活用を目的とした表面筋電波形の分析
- 自然言語インターフェースのための無発声音声認識への活用を目的とした表面筋電波形の分析
- 係り受け解析実験による動詞と格標識との多項関係共起知識の評価
- 複数製品の紹介記事からの製品情報抽出
- 多項関係としての格標識共起知識の獲得
- 多項関係としての格標識共起知識の獲得
- 複数製品の紹介記事からの製品情報抽出 : 製品記述パターンの分析
- 要件効果構造に基づく制限言語モデルを用いた法律文解析 : 並列構造の推定方法について
- 単一項目テンプレートによる新聞記事からの製品情報抽出
- 要件効果構造に基づく法律文統語構造解析
- 要件効果構造に基づく法律文制限言語モデルと法律文解析
- 辞書からの単語の主辞構造パターンの抽出
- 法律文における並列構造の特徴とそれに基づく制限言語モデルについて
- 法律文記述上の制約に基づいた計算機処理のための制限言語モデルについて
- 省略を用いた簡潔な処理による対話文生成法について
- 対話における焦点情報とそれに基づく応答文生成について
- 自然言語記述仕様書からのアルゴリズム抽出
- 動詞の機能に基づく法律文の制限言語モデル
- 動詞の機能に基づく法律文の制限言語モデル
- 囲碁(ゲーム情報学研究の事例)(ゲーム情報学)
- E-053 口裂周辺の筋電信号を用いた黙声日本語単母音認識のための認識パラメータ獲得手法(自然言語・音声・音楽,一般論文)
- Small World構造を用いた関連記事集合中の重要記事の判定(文書分類・要約)
- コールセンターDB構築・検索と質問回答作成支援システム(情報抽出・質問応答)
- 囲碁の観戦記からの知識獲得
- Jonathan Schaeffer and Jaap van den Herik, Chips Challenging Champions-Games, Computers and Artificial Intelligence-, Elsevier(2002), ISBN:0-444-50949-6
- 組合せゲーム理論を用いた囲碁の攻合いの解析
- 着手記号列の出現頻度に基づく囲碁棋譜からの定型手順獲得(ゲームプログラミング)
- 囲碁棋譜からの順序パタンとその共起知識の獲得
- Prefix-Closed B-tree
- 常識推論における推論の選択と文脈処理への応用
- 名詞シソーラスを用いた派生語の処理
- PCFGによる派生語処理手法の比較と検討
- Stolcke, A. : An Efficient Probabilistic Context-Free Parsing Algorithm that Computes Prefix Probabilities, Computational Linguistics, Vol.21, No.2, pp.165-201 (1995)
- 複合名詞の仮名漢字変換のための解析アルゴリズム
- シソーラスを利用した複合語の仮名漢字変換のための確率複合語文法
- 意味的結束性に基づく文脈処理
- 常識推論における推論の選択
- 日本語における動詞の造語モデルの作成
- 造語モデルにおける状態遷移確率推定法について
- 造語モデルに基づく単語表記の扱い
- 語彙機能文法の横型構文解析 : 否定演算を含む属性構造記述
- 論理関数の対称論理関数による最適表現とその応用
- Earleyアルゴリズムの並列化手法
- 確率文脈自由文法におけるパラメタの最尤推定法