人の発声単位を考慮した日本語言語モデルの検討 : 日本語における単語とは

スポンサーリンク

概要

論文の詳細を見る
日本語では単語の境界があいまいで、文法的に定義された単位は必ずしも人が認知している単語単位と一致しない。本研究では人の発声単位を考慮した単語単位の構成方法とそれに基づいた日本語言語モデルを提案する。本手法では人が単語境界と考える点で分割した比較的少量のテキストデータと形態素解析による分割結果とを照合することにより、人が潜在意識としてもつ単語単位を形態素レベルのパラメータでモデル化した。そして多量のテキストを同モデルにしたがった疑似乱数で分割することにより、単語単位のセットと言語モデルの訓練用データを自動生成した。
一般社団法人情報処理学会の論文
1996-11-18

著者

関連論文

もっと見る

スポンサーリンク