創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
スポンサーリンク
概要
- 論文の詳細を見る
多様かつ複雑な印刷文書をディジタル化することを目的とした論理要素抽出方式を提案する。本方式は、印刷文書(文書画像)に対してレイアウト解析を適用してテキスト、写真、図形、表などのレイアウト要素を抽出し、そこから見出し、ヘッダ、フッタ、キャプション、脚注、プログラム、章節タイトル、段落(パラグラフ)、リスト(箇条書き)、数式などの広範囲の文書に共通と考えられる論理要素を自動抽出することを目標としている。論理要素抽出システムには、人工生命でキーコンセプトとされている創発の概念を導入している。すなわち、多階層アーキテクチャを採用し、各階層を複数のモジュールで構成し(各モジュールは全体制御を受けない)、階層間では相互作用を可能とした。その結果、システムは複雑な処理手順を生成することができ、多様な文書構造に自己適合しながら複雑な文書を処理できるようになっている。実験では、本方式を様々なレイアウト構造および論理要素を持つ文書に適用し、その有効性を確認している。
- 社団法人電子情報通信学会の論文
- 1998-05-13
著者
関連論文
- 階層的モデルあてはめによるフォーム読み取りシステム
- 多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- LK-005 ペン操作型情報収集とイベント型情報再利用に基づく情報活用システム(K分野:ヒューマンコミュニケーション&インタラクション)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- I-71 デジタルカメラで撮影した展示パネル画像の認識(物体認識,I.画像認識・メディア理解)
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- 隣接関係ネットワークに基づく文字列抽出
- 連合グラフを用いたモデルマッチングによるフォーム理解
- データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析(21世紀のグループウェア)
- D-12-13 創発の概念を導入した文書画像構造解析
- 創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
- 創発に基づいた文書画像のレイアウト解析
- モデルマッチングによる表形式文書の理解
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)