DPマッチングを用いた表形式データの解析方法
スポンサーリンク
概要
- 論文の詳細を見る
オフィスで用いられる文書には表形式の文書が多く用いられ,OCRシステムで情報を電子化する際には文字情報のみでなく表のセル情報など付加的な情報も必要になってくる.本稿ではOCRシステムの認識結果に表の構造情報を付加するために,元の表の構造を保持したまま整形して認識結果をテキストファイル化する方法を示す.実際の表では一つの行に複数の文字列が配置されているようなこともあり表中の文字列の配列情報を解析し,構造を正確に抽出するのは難しい場合もある.本方法では配列情報の解析と整形を行なうためにDPマッチング法を文字列群に適用した.
- 1995-09-05
著者
関連論文
- 印刷文書認識システムAutoReco/2 : テキストプロセス
- 印刷文書認識システムAutoReco/2 : イメージプロセス
- 印刷文書認識システムAutoReco/2 : システムの構成と概要
- 表データのカット&ペーストの一方式
- 複雑なカラム構造をもつ文書イメージの領域分割法
- Line-Shared-Adjacent(LSA)セルフォーマットを用いたフォーム処理
- DPマッチングを用いた表形式データの解析方法
- 文書OCRにおける出力テキストの整形方法
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- ロジカルフォーマットをによる帳票処理