データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析(<特集>21世紀のグループウェア)
スポンサーリンク
概要
- 論文の詳細を見る
多様なレイアウト構造を持つ印刷文書を一括して読み取り, ディジタル化することを目的とした新しいレイアウト解析方式を提案する.本レイアウト解析方式は3つのデータ駆動型処理:領域統合, 領域解析, 領域認識と1つの概念駆動型処理:領域変更で構成されている.レイアウト解析システムでは処理モジュールが階層的に配置されており, 隣接するモジュール間で相互作用を可能としている.前処理により抽出された文字成分がレイアウト解析システムに入力されると, データ駆動型処理の相互作用を経て, 近接, 類同, 良い連続などの条件に基づいて文字成分が群化してクラスタを形成する.概念駆動型処理では, 誤った群化を解消するための仮説をそれぞれのクラスタに適用する.そして, デーダ駆動型処理と概念駆動型処理の相互作用により仮説が検証され, システムは最終的に, テキストブロックと文字行と文字の階層関係で記述されるレイアウト要素の集合を文書画像のレイアウト構造として出力する.新聞, 雑誌, 科学技術文献, 官報, 表形式文書, 書籍, 名刺などを対象とした実験では, 本方式が多様なレイアウト構造に適応していることと, 複雑なレイアウト構造を高精度に処理できることを確認することができた.
- 一般社団法人情報処理学会の論文
- 2001-11-15
著者
関連論文
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- I-71 デジタルカメラで撮影した展示パネル画像の認識(物体認識,I.画像認識・メディア理解)
- データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析(21世紀のグループウェア)
- D-12-13 創発の概念を導入した文書画像構造解析
- 創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
- 創発に基づいた文書画像のレイアウト解析
- モデルマッチングによる表形式文書の理解