カラー情景画像からの文字抽出高精度化の一検討(テーマセッション6,文字・文書の認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,カラー情景画像からの文字抽出において,できるだけ背景や文字の出現に制限を置かないロバストな手法について考察している.我々は以前,色空間上でのクラスタリングによる文字と背景の分離さらにSVMによる文字と背景の識別を行って文字を抽出する手法を提案してきたが,複雑な背景上に配置されたり,シェーディングの影響により文字色が変化したりしている場合は,文字の抽出性能が十分ではなかった.この主な原因は画像全体に対してクラスタリングを行った場合,文字色と背景色が近かったり,文字列の占める領域が画像サイズに比べて小さい場合には,文字色と背景色とが同じクラスタに分類され,文字と背景が分離されないことである.これを改善するため,以前の手法でも,まずエッジに基づき画像を大まかなブロックに分割し,各ブロックに対してクラスタリングを行う手法を提案してきた.しかしながらこのブロック分割では,背景のエッジが強い場合,文字列のエッジと結合して望ましいブロック分割が行われない場合が多く見られた.本稿ではエッジによる領域分割を行う際に,エッジの強度だけでなくエッジ上の色情報を用いて,背景と文字領域を分離する手法について述べる.この結果,以前の手法に比べて文字領域の推定精度が上がり,結果として文字抽出性能も向上させることができた.実験ではICDAR2003 Text Locating Competitionで用いられた251枚のカラー情景画像について文字抽出を行ない,本手法の有効性を確認している.
- 社団法人電子情報通信学会の論文
- 2008-02-14
著者
-
岡本 正行
信州大学大学院工学系研究科
-
山本 博章
信州大学大学院工学系研究科
-
白井 啓一郎
信州大学大学院工学系研究科
-
若林 昌格
信州大学大学院工学系研究科
-
岡本 正行
信州大学工学部
-
白井 啓一郎
慶応大学理工学部電子工学科
関連論文
- カラー画像平滑化のための色線形性を考慮した異方性拡散(画像)
- 3Dモデル形状とテクスチャ品質保持のためのメッシュパラメータ化(コンピュータグラフィックス(CG)基礎)
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化(高精細画像の処理・表示,及び一般)
- フラッシュ画像とノンフラッシュ画像の色彩と陰影の変換による鮮鋭画像生成法 (画像工学)
- 情景画像からの文字抽出(画像認識, コンピュータビジョン)
- 情景画像からの文字抽出(文字とドキュメントの認識・理解)
- 3Dモデルの高速な円筒ジオメトリ画像化法(コンピュータグラフィックス(CG)基礎)
- 小切手磁気インク文字読取のための背景およびサイン除去(テーマセッション3,複合現実感のためのパターン認識・理解)
- カラー情景画像からの文字抽出高精度化の一検討(テーマセッション6,文字・文書の認識・理解)
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化
- 3Dモデル形状復元のための頂点周辺密度均一化によるパラメータ化
- 拡張擬似木パターンマッチング問題に対するビット並列アルゴリズム
- 制限されたラベルをもつ木に対するビット並列型木パターン照合アルゴリズム
- D-002 XMLデータの暗号化に対応した安全な検索方法の提案(データベース,一般論文)
- 文字列上のビット並列法を利用した木パターン照合アルゴリズム
- 拡張正規表現所属問題および検索問題に対するDFA型アルゴリズムの効率的な実装について
- 拡張正規表現所属問題に対するDFAに基づいたアルゴリズム
- 動的に演算定義が可能な拡張正規表現照合システム
- オートマトンを利用した拡張正規表現照合アルゴリズムの実験的評価
- 正規表現をNFAへ変換するためのビット並列アルゴリズム
- A-033 正規表現をNFAに変換するためのアルゴリズムについて(A.モデル・アルゴリズム・プログラミング)
- 炭素材料の透過電子顕微鏡像への画像処理とファジィ推論の応用
- フラッシュ画像とノンフラッシュ画像の色彩と陰影の変換による鮮鋭画像生成法(画像応用技術,時空間映像処理,画像符号化及び一般)
- 正規表現からコンパクトなオートマトンを構成するための一手法
- 高速K-means法を用いたカラー画像の色量子化
- D-11-169 カラー画像からの文字抽出法としてのファジィクラスタリング
- 高速化K-meansクラスタリングを用いたカラー画像の色量子化
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 複数の一次元エッジから推定されるPSFを用いた手ぶれ除去(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- DPを用いた小型ディスプレイ閲覧用Webドキュメント解析とリフロー(テーマセッション,文字認識・文書理解)
- DPを用いた小型ディスプレイ閲覧用Webドキュメント解析とリフロー(テーマセッション,文字認識・文書理解)
- 小型ディスプレイ閲覧用 Web ドキュメント解析とリフロー(文書・文字メディアの認識・理解, 一般)
- 小型ディスプレイ閲覧用 Web ドキュメント解析とリフロー(文書・文字メディアの認識・理解, 一般)
- 小型ディスプレイ閲覧用 Web ドキュメント解析とリフロー
- 小型ディスプレイ閲覧用 Web ドキュメント解析とリフロー
- ウェーブレット変換による合焦画像の作成(画像)
- 情景画像からの文字抽出(文字とドキュメントの認識・理解)
- 10)セグメント・ブロック符号化方式に用いた画像の境界追跡アルゴリズム(〔画像通信システム研究会(第75回)画像処理・画像応用研究会(第79回)〕合同)
- セグメント・ブロック符号を用いた画像の拡大/縮小,回転,境界追跡アルゴリズム
- セグメント・ブロック符号化方式を用いた画像の境界追跡アルゴリズム
- 周辺分布特徴を用いた数式構造認識
- D-4-1 XMLデータの暗号化に対応した安全な木パターン照合方法の提案(D-4.データ工学,一般セッション)
- 記号列のラベルをもつ拡張擬似木パターンマッチング
- フラッシュ画像とノンフラッシュ画像の色彩と陰影の変換による鮮鋭画像生成法(画像)
- 多方向走査型SMFによるランダム値インパルス性雑音除去
- 大量の印刷数式画像を用いた数式認識システムの性能評価(文書・文字メディアの認識・理解, 一般)
- 大量の印刷数式画像を用いた数式認識システムの性能評価(文書・文字メディアの認識・理解, 一般)
- 大量の印刷数式画像を用いた数式認識システムの性能評価
- 大量の印刷数式画像を用いた数式認識システムの性能評価
- OCRソフトOCRopusへの数式認識モジュールの組込みの検討(テーマセッション,文字・文書の認識と理解)
- 合焦位置を起点とした文字列抽出の一検討(テーマセッション,文字・文書の認識と理解)
- パッチ分割を用いたイメージモザイキング
- パッチ分割を用いたイメージモザイキング
- パッチ分割を用いたイメージモザイキング
- 工学教育における高校教育の重要性
- 記号のレイアウトに注目した数式構造認識
- 日本語文書読み取りシステムの試作 (画像処理の新しい流れ)
- IPA'86 : IEEによる画像処理と応用国際会議
- 最適2-3兄弟木
- 2-結果比較器を用いたときの比較コスト最小2-3木
- 記号列のラベルをもつ拡張擬似木パターンマッチング
- 双対型positionオートマトンを用いたコンパクトなDFA表現
- 古文書字形検索のための画像処理
- 多方向走査平均処理と2×2雑音検出器を組み合わせたスイッチングメジアンフィルタ(画像)
- 正規表現に対するビット並列型検索アルゴリズム
- 多方向型スイッチングメジアンフィルタのエッジ情報をもとにしたしきい値算出の基礎検討
- 階層化的ブルームフィルタを用いた安全で効率的なキーワード検索法(データ工学,Web情報システム)
- OCROpUSを用いた数式を含む科学技術文献の読取りシステム(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- フラッシュ画像を用いたノイズ除去に関する一検討(無線通信のための信号処理及び一般)
- フラッシュ画像を用いたノイズ除去に関する一検討(無線通信のための信号処理及び一般)