拡張文節数最小法によるかな漢字変換
スポンサーリンク
概要
- 論文の詳細を見る
連文節単位のかな漢字変換の基本となる形態素解析手法には, 2文節最長一致法, 文節数最小法等, いくつかの方法が提案されている. 本論文では, このうち, 総あたりで全件検索を行うために高い精度が得られる, 文節数最小法を取り上げ, 文節数の数え方の概念を拡張して変換精度向上を狙った「拡張文節数最小法」を提案する. これを実現するために, 辞書引き, 文法チェックの結果を有向グラフに登録し, 変換対象の文字の入力, 解析がすべて終了するまで, 解析の結果を保持する構成とした. 有向グラフを構成する, 解析パスの先頭から文末までの文節相当数をガウントして, 最も文節相当数の小さいパスを変換結果とする. また, 有向グラフ上に, 2つの連続した形態素をペアにした学習機能を付加することにより, 文節学習機能(本方式の場合は, 形態素が学習の単位)を実現した. 本機能を用いて, 変換精度の評価を行ったところ, 学習なしの場合の正変換率はかな文字数換算の計算方法で95.8%, 文節数換算の計算方法で88.9%を得た. また, 文節学習機能を適用することにより, それぞれ2.1%, 4.8%変換率を向上させることができた. また, 辞書アクセスの前後で, 有向グラフの枝を伸ばすかどうかの判断を行うロジックと, 枝の性質の同じものを統合する方法を用いることにより, 計算機上で本アルゴリズムを実現したときの使用メモリを実用の範囲内に節約することができた.
- 一般社団法人情報処理学会の論文
- 1997-07-15