証拠の強さと信頼度を考慮した日本語同形異音語の読み分け
スポンサーリンク
概要
- 論文の詳細を見る
本稿では語彙曖昧性解消、特に日本語同形異音語の読み分けの一方式を提案する。Yarowskyの方式では、文脈に現れる読み分けのための証拠をその強さの順に並べて決定リストを構成する。この決定リストを用いると、新しく現れる同形異音語の読みは、もっとも強い証拠で判断される。しかし、証拠の強さだけでは、読みを正しく判断できないことがある。本稿では、証拠の強さだけでなく、その信頼度をも考慮して決定リストを学習する方法を提案する。実験によると、本方式により読み分けの正解率が改善された。
- 1997-05-26
著者
関連論文
- Strassenの行列積アルゴリズムのSX-3上でのインプリメント
- 5C-6 S400対応IEEE1394長距離アダプタの開発
- Bayes 方式によるMinimax符号
- 証拠の強さと信頼度を考慮した日本語同形異音語の読み分け
- MDL原理によるLaplace型推定量の導出と確率的PAC学習モデルによるその性能評価
- 編集にあたって(情報論的学習理論とその応用)
- モデル選択 : 自然言語処理を例に(情報論的学習理論とその応用)
- 編集にあたって(使いやすくなった自然言語処理のフリーソフト : 知っておきたいツールの中身)
- 機械学習技術のテキスト分類への応用
- ESCに基づく確率的決定リストを用いたテキスト分類
- ESCに基づく確率的決定リストを用いたテキスト分類
- 線形結合モデルを用いたドキュメント分類
- 心理言語学原理に基づいた確率的曖昧性解消法
- 一般化された実例と確率を用いた曖昧性解消