後続ひらがな列に基づく語の活用型推定(語彙知識)

スポンサーリンク

概要

論文の詳細を見る
新語や転用・派生語を収集して辞書を作成する場合,その語の品詞と活用型を認定する必要がある.動詞や形容詞は活用型ごとに異なる活用語尾を持つとともに,名詞の直後には格助詞が現れやすい.このような理由により,品詞や活用型の推定には,語幹に後続するひらがな列が強力な手がかりとなる.本稿では,このことを利用し,与えられた語幹の活用型を自動的に推定する手法を提案する.本手法では,あらかじめ,活用型ごとに特徴的な後続最長ひらがな列の出現傾向をコーパスから学習しておく.活用型の推定時には,その活用型の用例の出現回数を仮定する.そして,出現が期待される特徴的な後続最長ひらがな列がどの程度観察されるかに基づいて,当該活用型をとるか否かを認定する.本稿では,既知語を用いた本手法の性能評価,およびカタカナ文字列に対する活用型の推定実験の結果について報告する.
2008-07-10

著者

関連論文

もっと見る

スポンサーリンク