モデルマッチングによる表形式文書の理解
スポンサーリンク
概要
- 論文の詳細を見る
罫線によって囲まれた文字列領域を複数持つ様々な種類の表形式文書の構造をモデルマッチングにより理解する方式を提案する。本方式では、文書の基本構成要素である罫線を抽出し、さらに罫線を構成化することによって表を抽出する。さらに、これらの特徴を階層的に関連づけることによって関係構造を抽出して、文書画像を記述する。入力情報とモデルのマッチングは、二つの関係構造から連合グラフを作り、その連合グラフから最大クリークを検出することによって獲得される。連合グラフを構成する割り当て(対応可能な特徴の組)を抽出する際には、入力-モデル間で生じる種々の変動を考慮しており、柔軟かつロバストなマッチングを実現している。得られたマッチング結果が不完全である場合には、その箇所を自動的に検出し、すでに対応づいている結果を利用して正しい対応関係を推定することにより信頼性の高い処理結果を得る。実験では本方式を様々な構造を持つ表形式文書に適用し、その有効性を確認している。
- 社団法人電子情報通信学会の論文
- 1994-09-22
著者
関連論文
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- 表層表現抽出と文書構造解析に基づくXML文書変換システム(セッション1 : Web文書生成・管理)
- L-068 Webコンテンツの安全かつ簡便な再利用を可能とする編集技術Visual eXcart(L分野:ネットワークコンピューティング)
- 古文書翻刻支援システム開発(HCR)プロジェクト報告(2)
- I-71 デジタルカメラで撮影した展示パネル画像の認識(物体認識,I.画像認識・メディア理解)
- データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析(21世紀のグループウェア)
- D-12-13 創発の概念を導入した文書画像構造解析
- 創発的計算に基づく文書画像からの論理要素の抽出 : ドキュメントリーダによる既存文書のディジタル化
- 創発に基づいた文書画像のレイアウト解析
- モデルマッチングによる表形式文書の理解