統計的言語モデルとN-best探索を用いた日本語形態素解析法

スポンサーリンク

概要

論文の詳細を見る
本論文では, 統計的言語モデルとN-best探索アルゴリズムを用いた新しい日本語形態素解析法を提案する. 本方法は, 未知語の確率モデルを持つことにより任意の日本語文を高精度に解析し, 確率が大きい順に任意個の形態素解析候補を求められる. EDRコーパスの部分集合(約19万文, 約470万語)を用いて言語モデルの学習を行い, オープンテキスト100文に対してテストを行ったところ, 単語分割の精度は第1候補で再現率94.6%適合率93.5%, 上位五候補で再現率97.8%適合率88.3%であった.
一般社団法人情報処理学会の論文
1999-09-15

著者

関連論文

もっと見る

スポンサーリンク