ロバストなモデル照合に基づくFAX送信された一般帳票の読取り

概要

論文の詳細を見る
FAX送信された帳票上の手書き文字を読み取るFAXOCR装置では,帳票画像の変形やノイズにより文字認識する領域(フィールド)の抽出が困難である.この対策として,従来は帳票形式に制限を設けた専用帳票が用いられた.ここでは帳票形式に制限のない一般帳票も読み取り可能なフィールド抽出方式を提案する.本方式は,帳票画像から抽出した特徴点と帳票モデルの特徴点との対応付けに基づいて帳票画像の変形量を推定し,フィールドの位置を求める.この特徴点は一般的な帳票に含まれる表や文字列,イラスト等から抽出可能なため,多様な形式の一般帳票に適用できる.また,特徴点の消失や余計な特徴点の湧き出しに対してロバストに変形量の推定を行うため,ノイズ等による帳票画像の劣化に強い特性をもつ.FAX特有の変形を加えた50種類,計650枚の一般帳票画像に本方式を適用し,その有効性を確認した.また,フィールドデータに対して実用レベルの性能(帳票棄却率3.5%)を得た.
社団法人電子情報通信学会の論文
2002-09-01