同音語誤りリストからのかな漢字変換辞書作成
スポンサーリンク
概要
- 論文の詳細を見る
かな漢字変換において同音語誤りを減少させることは大きな課題である. 大規模なテキストを漢字かな変換を用いてかな漢字変換用テスト例文を作成し, かな漢字変換を評価するシステムの構成法が報告されている. 本論文では, このようにテキストから作成したテスト例文でかな漢字変換を行い, そこから同音語誤りリストを得る. ある入力文字列に対してある程度一意的に決定されるような出力文字列となる複合語・連語を自動抽出する. 最後に人手により読みを確認してシステム辞書に登録する. 堅実な方式ではあるが着実に同音語誤りを減少させることが可能である.
- 一般社団法人情報処理学会の論文
- 1994-03-07
著者
-
鳥原 信一
日本アイ・ビー・エム(株)東京基礎研究所
-
鳥原 信一
日本アイ・ビー・エム株式会社東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム(株)東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム 大和研究所
関連論文
- 代表読み辞書を用いた交ぜ書き漢字変換
- かん字漢字変換の変換率について
- 表記変換つきの形態素解析プログラムとその応用
- 連文節かん字漢字変換
- 2ZA-2 音声対話を含むマルチ・モダル型ユーザ・インターフェースの実装とそのユーザビリティの評価の検討(マルチモーダル,一般講演,インタフェース)
- 日本語テキスト音声合成のための言語処理の検討
- 音声対話を含むマルチ・モダル型ユーザ・インターフェースの在宅健康管理システムへの適用
- コーパス間の類似度によるコーパス分類と専門分野別辞書構築
- N-gramによる同形語の読み分け
- 漢字N-gramを用いた読み付与システム
- 漢字N-Gramによる日本語テキストの読み付与
- 同音語誤りリストからのかな漢字変換辞書作成
- かな漢字変換から拡張・一殿化した日本語処理プラットホームの提案
- テキストの共起単語情報を用いたかな漢字変換
- テキスト・ベースかな漢字変換
- かな漢字変換と漢字かな変換を共に用いる同音語誤りの検出方式
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- カナ姓名のペン入力後処理における予測処理について
- 認識文字候補からの高速予備選択法
- 日本語Dictation Systemのための統計的言語モデルに関する一考察