インタネット上のデータを利用しての中国語単語分割における曖昧性の解消
スポンサーリンク
概要
- 論文の詳細を見る
本稿は、中国語単語分割の過程で生ずる複数の単語結合候補の中から正しい単語結合を決定するための手法とその手法をもとに行った実験結果を報告する。ここでは、最初に双方向最大一致法によって単語結合候補を検出する。次に、コーパスからの統計量を使い、候補中の単語間の単語関連度を計算する。その際、希薄性の問題に対処するため、インターネット上のデータを使用する。最後に、単語関連度と文脈を考慮して正しい単語結合を選択する。本手法を評価するための実験では、84.1%の正解率を得ることができた。
- 社団法人電子情報通信学会の論文
- 2000-10-20
著者
-
古郡 延治
電気通信大学情報工学科
-
呉 浩東
独協大学 言語文化学科
-
韓 東力
電気通信大学情報工学科
-
古郡 延治
電気通信大学 情報工学科
-
韓 東力
電気通信大学情報工学科:(現)青山学院大学理工学部情報テクノロジー学科
-
古郡 延治
電気通信大学
関連論文
- 単語の結束性にもとづいてテキストを場面に分割する試み
- 英語辞書を利用した単語の類似度の計算
- 要素間の依存関係に基づく複合語の構造分析(自然言語処理)
- 文脈情報を利用した多文字複合語の分割
- 誤り駆動モデルに基づく中国語未登録語の認識
- 日本人の英語の特性を考慮した誤綴訂正
- インタネット上のデータを利用しての中国語単語分割における曖昧性の解消
- 概念情報に基づく前置詞句係り先の曖昧性の解消
- Prepositional Phrase Attachment Disambiguation Using Preference Rules and Conceptual Information
- Right Attachment of Prepositional Phrases by Using Reference Strategy
- 係り受け関係と相互情報量を用いた単語の意味獲得