大語彙かな漢字変換 : 未登録語と区切り誤りの減少

スポンサーリンク

概要

論文の詳細を見る
従来、かな漢字変換システムは、限定された大きさの辞書と、無数のヒューリスティックルールという組み合わせを基本として進歩してきた。現在の主流である、10万語前後の単語辞書とヒューリスティックルールからなる方式において、文節単位の変換率は80〜85%程度であり、ほぼ限界に達している。しかし、まだユーザの修正作業が多く、一層の変換率向上が望まれている。筆者らは、変換率向上のための新しい方式として、数十万語以上の規模の単語辞書と、単語間の関係を限定する大規模な制約データを中心とする大語彙かな漢字変換方式を提案し、従来方式と比較しながら考察した。本稿では、大語彙かな漢字変換方式の概要を説明し、また、本方式が未登録語および変換率に与える効果を確認するために、大語彙(31万語)の単語辞書を試作して実験を行い、未登録語の出現率と、単語区切り正解率を調べたので報告する。
一般社団法人情報処理学会の論文
1990-09-04

著者

関連論文

もっと見る

スポンサーリンク