多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
スポンサーリンク
概要
- 論文の詳細を見る
多様な印刷文書をディジタル化するための文章構造解析方式について述べる。文書構造解析は文書画像からテキスト、写真、図形、フォーム領域を抽出し、テキスト領域からタイトルやパラグラフなどのレイアウトオブジェクトとその文字列を抽出するものである。本方式は(a)多階層構造、(b)階層間相互作用、(c)創発された大域構造とシステムとの相互作用というアーキテクチャを持つ。各階層は複数の処理モジュールで構成され、大域的な制御を受けず局所的に動作する。上位階層は下位階層の処理結果を変更、訂正、棄却、再調整でき、下位階層の挙動に対する境界条件を生み出す。このような階層間相互作用によりシステムは複雑な処理手順を生成することができる。また上記(c)によりシステムは文書構造に応じて動作するため多様な文書構造に自己適合でき、「縦書きと横書きのテキスト領域と図形が近接し入り組んでいる」という複雑な文書構造を解析することが可能となる。実験では本方式を様々な幾何構造を持つ文書に適用し、その有効性を確認している。
- 社団法人電子情報通信学会の論文
- 1997-03-06
著者
関連論文
- 階層的モデルあてはめによるフォーム読み取りシステム
- 多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- LK-005 ペン操作型情報収集とイベント型情報再利用に基づく情報活用システム(K分野:ヒューマンコミュニケーション&インタラクション)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- I-71 デジタルカメラで撮影した展示パネル画像の認識(物体認識,I.画像認識・メディア理解)
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- 隣接関係ネットワークに基づく文字列抽出
- 連合グラフを用いたモデルマッチングによるフォーム理解
- D-12-13 創発の概念を導入した文書画像構造解析
- 創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
- 創発に基づいた文書画像のレイアウト解析
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)