カラーメージからの文字抽出法についての試案
スポンサーリンク
概要
- 論文の詳細を見る
書誌データと目次イメージの共存するデータベースシステムを構築し、マルチメディア・ドキュメントシステムとしての電子図書館を意図したデータ入力システムの開発を行っている。具体的には目次のイメージデータから書誌情報(論文名、著者名、ページなど)の抽出を目指している。印刷媒体を電子媒体上のコードへ変換する方法としてOCRの研究が行なわれているが、OCRの実用化を目指す上で克服しなければならない問題は数多く指摘されている。これらの問題に加え、本システムが対象としている目次イメージの認識では、1)ページ中に写真・模様・罫線などの非テキストイメージが散在している、2)論文名の長さ・著者名の長さや数が不定である、という問題もある。これまでは目次イメージ用OCRのかかえる諸問題のうち、1)ページイメージをテキストとそれ以外の領域にセグメント化する、2)テキスト領域をより詳細にセグメント化する、方法についての検討を行い一定の成果をあげつつある。ところで、これまでのOCRでは地が白で文字は黒である(あるいはモノクロ走査において、地の輝度が文字の輝度に対して有意に高い)ことが暗黙の前提条件であった。しかし、デザインなど都合上から目次イメージではこの前提を満たさないことが多い。本稿では、地と文字が多様なカラー特性を示す目次イメージから文字情報を抽出する方法について考案する。ここで考案した方法では、地の輝度が文字の輝度よりも高いといったこれまでのOCRにおける制約を受けることはないが、「文字や地の特性はある程度の広さの領域内でほぼ均一である」という拘束条件が存在する。
- 一般社団法人情報処理学会の論文
- 1991-02-25
著者
関連論文
- ドキュメント・デリバリーのための電子図書館 : リソースシェアリングをめぐる制度的枠組み
- 芸術家の技術保存用ビデオデータベースの構築・公開・研究計画
- テキストイメージのテクスチャ性を利用した領域分割法
- データ従属性に基づくデータベースの合成
- カラーメージからの文字抽出法についての試案
- 映像アーカイヴの利用者調査実験とその結果
- 文法記述によるデータベース入力支援法
- 文書画像理解を用いた電子図書館ユーザインタフェースの自動生成
- 文書画像データベースのためのハイパーテキスト構築手法
- データベース入力支援を目的とする文献画像の分類方法
- 浜野保樹著 ハイパーメディア・ギャラクシー : コンピューターの次にくるもの, 福武書店, 1988.9, A5, 262p, \1,500, (税別), ISBN 4-8288-1178-8, コンピュータの終焉 : ハイパーメディア・ギャラクシーII, 福武書店, 1989.9, A5, 262p, \1,600, (税含む), ISBN 4-8288-1193-1