印刷文書認識システムAutoReco/2 : システムの構成と概要
スポンサーリンク
概要
- 論文の詳細を見る
電子ファイル・システムによる保管と検索、さらにはCD-ROM等の新しいメディアの登場に伴い、オフィス環境は急速に変化している。しかしながら、オフィス情報の大部分は依然として「紙」のままであり、情報の分類、保管、検索、加工、および再利用を困難にしている。すなわち、情報を蓄積して活用するためには既存の情報の再入力が必要であり、そのデータ再入力コストが電子ファイル・システム等を構築する際に大きな障害となっている。既存の印刷文書の再入力に関しては、OCRによる文字認識技術に大きな期待が寄せられているが、テキスト領域やレイアウトの構成要素をいちいち指定するのはユーザーにとって手間のかかる作業である。さらに、将来的には文書をイメージ・データとしてではなくマルチメディア・データとして管理するデータベースが普及すると予想される。このマルチメディア文書データベースでは、テキスト情報、イメージ情報、図情報、表情報等を蓄積し、文書のレイアウト/論理構造も合わせて記録しておくことが必要とされる。また、認識結果の修正に要する時間の短縮は、認識処理のスループットを向上させるためには重要である。筆者らは文書のレイアウト解析、認識結果の文脈後処理、およびグラフィックス表示によるユーザー・インターフェースを備えた日本語印刷文字認識システムの開発を通して上述の問題点の解決を図ったのでその概要を報告する。
- 一般社団法人情報処理学会の論文
- 1993-09-27
著者
-
加藤 美治
武蔵大学
-
加藤 美治
日本アイ・ビー・エム株式会社
-
平山 唯樹
日本アイ・ビー・エム東京基礎研究所
-
山下 晶夫
日本アイ・ビーエム東京基礎研究所
-
山下 晶夫
日本アイ・ビー・エム株式会社 東京基礎研究所
関連論文
- トーイ・プロジェクトを活用したプロジェクトマネジメント教育の研究(プロジェクトマネジメント教育を考える)
- 2504 トーイ・プロジェクトを活用したプロジェクトマネジメント教育の研究(一般セッション)
- クウォンティン・フレミング,ジョェル・コッペルマン著「アーンド・バリューによるプロジェクトマネジメント」, 監訳:PMI東京支部, 発行所:日本能率協会マネジメントセンター, 発行日:2004年6月15日, 体裁:B5判, 242ページ, 価格:\3,990(税込), ISBN:4-8207-4192-6
- 2710 ビジネスゲームを活用したチーム育成教育の研究(一般セッション)
- 文書への自動論理構造タグ付けの向上に関する研究
- 文書画像のレイアウトモデル作成方式
- 製品開発プロジェクトにおけるコミュニケーション・マネジメント事例(コミュニケーション・マネジメント)
- 3-15 製品開発プロジェクトにおけるコミュニケーション・マネジメント事例
- 分散オブジェクト環境における文書入力フレームワークの研究
- 文字の部分特徴を利用した枠接触文字の認識
- 印刷文書認識システムAutoReco/2 : テキストプロセス
- 印刷文書認識システムAutoReco/2 : イメージプロセス
- 印刷文書認識システムAutoReco/2 : システムの構成と概要
- 非巡回型グラフサーチを用いた日本語文書の文字切り出し方式
- 表データのカット&ペーストの一方式
- モデルに基づいた文書画像のレイアウト理解
- 複雑なカラム構造をもつ文書イメージの領域分割法
- Line-Shared-Adjacent(LSA)セルフォーマットを用いたフォーム処理
- DPマッチングを用いた表形式データの解析方法
- 文書OCRにおける出力テキストの整形方法
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- ロジカルフォーマットをによる帳票処理