解析誤りデータを用いたコスト最小法形態素解析のコスト関数の構成方法
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, コスト最小法形態素解析においてコスト設定規則が付与するコストの値を, コーパスを用いて, 自動的に決定する方法について述べる. コスト決定に用いるデータとしては, 形態素プログラムによる単語分割と, コーパスにある単語分割を比較し,一致しない文について, 解析結果の単語分割と, コーパスの単語分割を組にしたものを用いる. 収集したデータについて, コスト規則適用回数のベクトルの差を計算し, これに文識別子を付与したものを標本とする. すべての標本の平均を, コストの値とした. 300文のテキストを用いて評価を行い, コーパスとの自動比較による評価で, 約90%の精度を得た.
- 一般社団法人情報処理学会の論文
- 1998-01-19
著者
関連論文
- マルチエージェントによる頑健な自然言語処理の協調方式
- マルチエージェントによる頑健な自然言語処理方式の提案
- 要約支援システムCOGITO (自然言語理解)
- 要約支援システムCOGITOの文脈表現形式
- 要約支援システムCOGITOにおける文章の重要性評価について
- コスト最小法形態素解析のコストルール作成実験
- 要約支援システムCOGITO : 「テキスト・パーサ」によるテキスト解析
- 解析誤りデータを用いたコスト最小法形態素解析のコスト関数の構成方法