創発に基づいた文書画像のレイアウト解析
スポンサーリンク
概要
- 論文の詳細を見る
紙形式の文書を電子化するドキュメントリーダに対する要求が高まっている。ドキュメントリーダではオペレータの作業軽減を目的としてタイトル、ヘッダ、フッタ、カラムなどの論理オブジェクトを抽出するレイアウト解析機能の実現が重要である。しかし新聞、論文、雑誌、明細書など多様なレイアウト構造を持つ文書では●文字サイズ、文字間距離(字間)、文字行間距離(行間)が異なる様々な部分領域が混在している●縦書き文章と横書き文章が混在している●図形や写真・絵、ノイズなどの非文字領域が混在している●分離文字、欠損文字や接触文字が存在するといった様々な性質が見られる。文書によってはある文章領域の文字間距離は他の領域の文字行間距離や段組間距離よりも大きい場合があったり、部分的に字間や行間が不規則な領域が存在する場合があり、論理オブジェクト領域を正確に推定することは難しい。 本報告ではこのような困難点を解決できる文書画像のレイアウト解析方式を提案する。
- 社団法人電子情報通信学会の論文
- 1996-03-11
著者
関連論文
- 階層的モデルあてはめによるフォーム読み取りシステム
- 多階層構造と階層間相互作用に基づく文書構造解析 : 多様な印刷文書を対象とした文書認識システム
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- LK-005 ペン操作型情報収集とイベント型情報再利用に基づく情報活用システム(K分野:ヒューマンコミュニケーション&インタラクション)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- I-71 デジタルカメラで撮影した展示パネル画像の認識(物体認識,I.画像認識・メディア理解)
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- OCR誤りに対してロバストな文書画像を対象としたモデルベースト情報抽出
- 隣接関係ネットワークに基づく文字列抽出
- 連合グラフを用いたモデルマッチングによるフォーム理解
- データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析(21世紀のグループウェア)
- D-12-13 創発の概念を導入した文書画像構造解析
- 創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
- 創発に基づいた文書画像のレイアウト解析
- モデルマッチングによる表形式文書の理解
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)
- 紙文書を対象としたピボットXML文書に基づくXML文書変換システム(文字とドキュメントの認識・理解)