レイアウト的特徴に基づいた文書画像の分類
スポンサーリンク
概要
- 論文の詳細を見る
文書画像から有意な情報を自動的に分離・抽出する課題に文書画像理解がある。様々な文書に対して、今日までに報告された方法、アプローチの多くは、文書に関する知識である文書モデルに基づいて文書画像を解釈する枠組みとなっている。この文書モデルをできるだけ汎用化することにより、汎用型の文書画像理解システムを開発する試みも報告されている。しかし、文書にはその応用域に依存して様々な型、クラスが実社会で利用されており、一つの文書モデルで対処することは不可能である。汎用化した文書モデルに基づいた試みも、そのためその適用域は限られ、ほぼ同種の文書しか処理できないのが現状である。我々は汎用型文書画像理解システムを開発するために、文書を階層的に捉え(文書類、文書型、文書クラス)、各レベルにおいてある特徴に基づいてグループを規定する。そして、分類・検証・識別・再分類処理を繰り返し、該当する文書に順次絞り込む方法を既に提案し、第一段階として、物理的特徴に基づいて文書類を分類した。本稿では、レイアウト的特徴に基づいて分類された文書類を検証し、更に文書型を識別する方法及び実験結果について報告する。
- 一般社団法人情報処理学会の論文
- 1996-09-04
著者
関連論文
- D-045 地理情報システムでのイベント管理に向けたBlog処理(D分野:データベース)
- イベントモデルによる地理情報の取扱い(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 近似経路に基づく配送車両の索引手法(セッション1B : インデクス)(夏のデータベースワークショップ : DBWS2004)
- 知識ベースに基づいた図書目録カードの理解
- 長時間トランザクションにおけるタスクフローを用いたトランザクションの実行制御
- 発想支援対話における協調的応答のための発話プランニングモデル
- イベントと状況変化の依存関係に基づいた野球中継のインデキシング支援
- イベント-アクション・モデルに基づく動画像検索システムSTRIKE
- タスク結合によるタスク実行の効率化とタスクスケジューリング
- オブジェクト指向パラダイムに基づくワークフローの構成法
- ワークステーション・クラスタ環境における並列化コンパイラの構成
- 関数呼出し文並列化手法に基づいた粗粒度プロセス生成手法
- 分散プロセス間における大域変数の共有方法
- 概念階層属性による属性集合を取り入れる事例ベース構造
- 分節化に基づいたマルチメディア・データのモデル化
- LISP知的教授システムにおける教師モデル機構
- TMS的機構に基づいたプログラム言語教授における学習者モデル
- エージェントの概念に基づいた長時間トランザクション管理
- ハイパービデオを用いたビデオ・データベースの効率的なブラウジング手法
- 状況変化に基づく内容推定によるビデオ・データベースのインデキシング支援
- レイアウト的特徴に基づいた文書画像の分類
- HARMONY:適応型協調学習環境の構築 (教育における認知的アプローチ/一般)
- 複数の解導出過程が存在する問題における学習状況把握機構
- 協調学習支援のための解導出シナリオによる学習状況把握機構の枠組
- ライフログ内の記録画像を対象とした撮影コンテクストに基づく検索(セッション4A : 画像DB)(夏のデータベースワークショップ : DBWS2004)
- 動画像セグメント検索のためのモデル化手法
- 構成要素間の位置的/意味的関係に基づいた道路情報の抽出
- イベント-アクティビティ・モデルに基づくシーン検索における可変的な役割の利用
- 時区間の抽象化階層に基づいたオブジェクトの状態表現モデル