Geometric Hashingを用いた帳票識別
スポンサーリンク
概要
- 論文の詳細を見る
一般オフィスでは,各種伝票,名簿,一覧表,銀行の振込依頼書,企業の財務諸表など,多種多様の帳票文書が取り扱われている.近年,計算機を用いた画像ファイリングが一般オフィスで用いられるようになるにつれて,これらの帳票文書から,必要な情報のみをとりだし計算機に入力することが望まれるようになってきた.これらの情報を効率よくファイリングし,検索に利用するためには,帳票の種別ごとにデータを入力・管理することが必要であり,入力帳票の特徴を自動的に抽出し,帳票種別を自動識別することが要求される.帳票識別を実用化するためには,1.文字の記入などによる画像の変動や入力画像のノイズや掠れなどによる情報の欠落の影響をうけない.2.画像の傾き・位置ずれ・伸縮などの変動を吸収する.3.多種多様の帳票に対応できるように,対象帳票の種類に依存しない.4.登録帳票が増えても検索時間が遅くならない. の点を考慮しなければならない.即ち,入力で生じる画像の変動や,情報の欠落の影響をうけない柔軟かつロバストなアルゴリズムを構築する必要がある.我々は,これらの問題点を解決するために,帳票文書は枠領域(以下セルとよぶ)と,文字列から構成されていると考える.帳票上のセル領域は帳票上に文字が記載されても変わらない比校的普遍な情報である.これに対し,文字情報は追記されることによって変動が大きい情報である.したがって,セルの位置情報を帳票の特徴として帳票識別を行うことを考える.ここで,帳票文書をセルで表現し,セルの中心点をそのセルの代表点とした場合に,類似帳票識別は点マッチングの問題として考えることができる.図1に帳票文書からセルを抽出した例を示す.帳票の種別をセルの構造で識別することは,上記問題点を考慮した上での2枚の画像中の長方形領域の対応関係を検証することである.そこで,本論文では,領域対応を各領域の代表点対応問題と考え,点マッチングの方法として知られているGeometric Hashingを応用してこの問題を解くことにより帳票識別を行なう.Geometric Hashingとは,データの整理方法であるハッシュ法を画像認識に応用したものであり.モデルから2次元不変量を計算してHash Tableを作成した後,入力画像から計算された不変量に基づいてHash Table上を検索する手法である.以下では,本手法の詳細なアルゴリズムを述べると共に,実験によりその有効性を示す.
- 社団法人情報処理学会の論文
- 1995-09-20
著者
-
浅野 三恵子
(株)東芝研究開発センター情報通信システム研究所
-
浅野 三恵子
東芝研究開発センター
-
下辻 成佳
(株)東芝研究開発センター情報通信システム研究所
-
下辻 成佳
(株)東芝研究開発センター
-
下辻 成佳
東芝研究開発センター
-
下辻 成佳
(株)東芝 研究開発センター
関連論文
- セル構造を用いた帳票識別
- Geometric Hashingを用いた帳票識別
- 輪郭・骨格・画像情報の統合による緑図形からのオブジェクト抽出
- 局所濃度情報を用いた低品質図面認識のための前処理手法について
- 1)文字印刷品質検査システムの開発([画像通信システム研究会 画像応用研究会]合同)
- 文字印刷品質検査システムの開発 : 画像通信システム,画像応用
- 文字印刷品質検査システムの開発
- 画像処理による電子色フィルタ技術
- 文書・文字認識の実用化を阻むもの
- セル構造を用いた帳票識別
- 映像ブラウジングのための類似ショット統合 ( ビデオとハイパーメディアのインターフェース、および一般)
- 細胞・輪郭線を用いた図形の高品位な直線・円弧近似手法について
- 文字認識を用いたマルチスケール文字列抽出手法
- 認識により限定した文字列要素を用いた任意方向文字列抽出
- 文字認識を用いたマルチスケール文字列抽出手法
- ベクトル編集と同様の操作性を持ったイメージ編集機能の開発
- 二次記憶の並列化による高速画像アクセスの最適化手法について