文書検索のための飾り文字画像の復元方式
スポンサーリンク
概要
- 論文の詳細を見る
新聞の見出し等の情報を検索に利用するための飾り文字の復元手法について報告する.見出しには文書の内容を表す重要な情報が含まれているが, 文字の背景にテクスチャを持つ, 白黒が反転している等が原因で通常のOCRで処理できないことが多い.本報告では文書画像処理結果の複数候補を検索時に利用する手法を仮定して, 単純な画像フィルタの組合せによって飾り文字の見出しから既存OCRで認識可能な画像を生成できることをしめす.用いたのは水平/垂直方向にOpeningを行うモルフォロジカルフィルタと白黒反転のみである.JEIDA画像データベース中の新聞紙面の見出しに本手法を適用した後と, 市販のOCRソフトで認識を行い有効性を検証した.
- 1998-07-15
著者
関連論文
- Webサービスの将来(Webサービス)
- Webサービスの系譜(Webサービス)
- Webサービスのパターンとベストプラクティス(Webサービス)
- ビジネスで使うWebサービス(Webサービス)
- 戸籍データ入力のための文書画像解析システム
- モデルに基づいた文書画像のレイアウト理解
- 文書検索のための飾り文字画像の復元方式
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- レイアウト構造を利用したページ記述への電子透かし埋め込み手法
- 黒画素塊の上下境界に着目した文書画像の解析方式
- 上下境界線分に着目した文書画像からの黒画素塊検出方式