逐次出力型ビームサーチによる文字切り出しの実験と検討(テーマセッション,文字・文書の認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
文字認識における文字切り出しにビームサーチを用いるケースについて検討を行なった.切れ目の無い長い文にビームサーチを単純に用いると,ビームの幅分しか文字切り出し候補が得られず,文字間接触の多いフリーピッチ文字列などのように文字切り出しが難しいケースに対しては,その候補数が不足し,結果的に正解の区切位置が候補に残らないという問題があった.これに対してビーム幅を増やすという案があるが,それでも候補数を数多く得るには実装上の限度がある.本研究は,文字切り出し候補探索時に自動的に文字候補列を分割し,この分割した文字候補列を逐次出力する方式について,その有効性を実験的に検討したものである.その結果,英文や品質の悪い日本文において認識精度向上の効果を確認することができ,このようなアプローチが品質の悪いドキュメントに有効であることが分かった.
- 社団法人電子情報通信学会の論文
- 2010-02-11
著者
関連論文
- 最急降下法による学習プロセスの可視化技術とLVQの観察(テーマセッション6,複合現実感のためのパターン認識・理解)
- 逐次出力型ビームサーチによる文字切り出しの実験と検討(テーマセッション,文字・文書の認識・理解)
- 部分空間法の今昔(いまむかし)(上) : 歴史と技術的俯瞰 : 誕生から競合学習との出会いまで
- 類似文字識別のための単純類似度を用いた特徴フィルタ・マスク学習(テーマセッション5,文字・文書の認識・理解)
- 類似パターン識別における特徴抽出のフィルタ・マスク学習(テーマセッション6(オフライン処理),文字・文書の認識・理解)
- 文字認識分野における確率降下法の応用(テーマセッション(3),パターン認識・メディア理解のための学習理論とその応用)
- LVQの学習プロセス可視化技術による認識精度急変位置の状況観察(テーマセッション,文字・文書の認識と理解)
- 学習プロセス可視化技術によるLVQ学習の分岐する位置の観察(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)