正規化頻度による形態素境界の推定

スポンサーリンク

概要

論文の詳細を見る
本論文では著者がすでに提案している統計的手法による形態素境界の推定法の改善について検討した結果を述べる. 著者の手法では, 分かち書きされていない日本語テキストから形態素境界を推定するために, まずNグラムの統計情報(頻度, 頻度の期待値や分散)から文字列の正規化頻度を計算し, 次にそれを用いて語の境界を獲得する. しかし解の探索条件を変えることによって, より解析精度を向上させることができることがわかった. EDR日本語コーパスを用いた実験の結果, 得られた境界と形態素境界の適合率は82.00%, 再現率は82.20%であった. なお本手法は既存の形態素解析の手法と重複する部分がないため, 両者の併用によってさらに解析精度の向上が期待できる.
一般社団法人情報処理学会の論文
1996-05-27

著者

関連論文

もっと見る

スポンサーリンク