認識文字候補からの高速予備選択法
スポンサーリンク
概要
- 論文の詳細を見る
オンライン文字認識装置において、単語の部分的な文字の入力からいくつかの候補単語を推定、表示し、それらの中からユーザーが選択できるようにしたい。本稿ではこの候補単語の推定のことを予備選択と呼ぶ。この予備選択により、高速に候補を部分的入力からも推定できるようになるので、ユーザーが速くペン入力を使用できるようになる。予備選択のためには、頻度情報を持った語い集と、一文字ずつの文字認識のスコア付の認識結果を使う。認識装置には誤認識はつきものであるが、選択すべきリスト中に正解単語が無いのは非常に不都合である。そこでこの予備選択時にはたとえ認識結果からの組み合わせからは出てこない単語でも、それが一文字の置換程度で得られ、かつ、頻度の高いあるいは語い集に載っているものならば、結果のリスト中に残るような、認識の耐雑音性とでもいうべき仕組みが必要である。また、予備選択は軽い処理である必要がある。これに時間がかかるようでは次の文字を入力した方が早いことになり意味がなくなる。本稿では、この2つの点、認識の耐雑音性と、処理の軽さを実現する手法として、単語ごとの文字の出現行列を使い、認識装置からの一文字ごとの認識結果に対しその文字が各単語に含まれているかどうかを調べるものを提案する。さらにインプリメンテーション、予備実験の結果を示す。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
-
野崎 広志
日本アイ・ビー・エム(株)東京基礎研究所
-
野崎 広志
日本アイ・ビー・エム 大和研究所
-
菅原 一秀
日本アイ・ビー・エム株式会社東京基礎研究所
-
菅原 一秀
日本アイ・ビー・エム(株)東京基礎研究所
関連論文
- 同音語誤りリストからのかな漢字変換辞書作成
- かな漢字変換から拡張・一殿化した日本語処理プラットホームの提案
- テキスト・ベースかな漢字変換
- かな漢字変換と漢字かな変換を共に用いる同音語誤りの検出方式
- オンライン文字認識における後処理 : 住所・姓名の文字補完機能
- カナ姓名のペン入力後処理における予測処理について
- 視覚障害者用文書処理システムにおける情報伝達法
- 視覚障害者用文書処理システムにおける情報伝達法
- 確率的シミュレーションアルゴリズムの時間領域量子化
- 4-3 光学的メディアリーダ (21世紀の医療・福祉を支える科学技術)
- 視覚障害者用OCRシステムの開発
- 視覚障害者用OCRシステムの設計
- 縦横行の混在した文書からのテキスト行抽出法
- 視覚障害者用文字認識システムにおけるレイアウト/論理情報抽出法
- 視覚障害者用文字認識システム
- ニューロ・ファジィ・遺伝的アルゴリズム 萩原将文(著)
- 認識文字候補からの高速予備選択法
- ドットマトリクスの回転算法の変換群について
- 音声情報検索システム
- 音声テンプレート統合法
- 日本語Dictation Systemのための統計的言語モデルに関する一考察