最適2次元セグメンテーションによる情景内文字抽出(画像認識,コンピュータビジョン)
スポンサーリンク
概要
- 論文の詳細を見る
情景内文字認識において,情景画像から文字領域を正しく抽出することは重要である.しかし,情景内文字は多様な文字配置と複雑な照明・外光条件を伴うため,文字抽出は依然未解決の課題である.本論文では,画像の部分領域に対する文字/非文字の識別器として文字認識を用いながら,最適な2次元セグメンテーションを併用することで,極力高精度に文字抽出を行う手法を提案する.本手法は,2値化のしきい値を段階的に変えて得られる2値画像集合の中に各文字が明瞭に現れる段階が含まれることに着目し,2値画像集合における個々の連結成分を文字仮説とする多重仮説を生成する.そして,2次元最適化の枠組みで,文字仮説の近傍を考慮しながら最適な仮説を選択することによって文字抽出を行う.以上の考え方を,しきい値を変えながら得られた文字認識結果をノードとするコンポーネント・ツリーとグラフカットを利用して実現する.
- 一般社団法人電子情報通信学会の論文
- 2014-03-01
著者
関連論文
- 付加情報の一般的な割当(パターン認識)
- 相互制約付き多数決型アルゴリズムによる時系列パターン認識(研究速報)
- 4.パターン認識・メディア理解の問題分析(パターン認識・メディア理解のグランドチャレンジ)
- 5.パターン認識・メディア理解の10大チャレンジテーマ(パターン認識・メディア理解のグランドチャレンジ)
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法 (ヒューマン情報処理)
- 逆投影と幾何拘束を用いた2D/3D位置合せ(画像認識,コンピュータビジョン)
- 並列Fast Level Set Methodによる移動体の高速な三次元形状復元(幾何解析と形状復元,画像の認識・理解論文)
- 文字認識技術を利用した講義動画のスライド同定--文字配置の類似度によるスライド同定方式と講義動画のスライド同定作業コストの削減効果
- 大局的最適化に基づくトラッキング : DPトラッキング(追跡・位置合わせ,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- ペン先画像からの手書き復元(研究速報)
- 検出容易な文字パターン生成に関する検討(テーマセッション1,複合現実感のためのパターン認識・理解)
- ペン先カメラ画像からの手書きパターンの抽出(テーマセッション1,複合現実感のためのパターン認識・理解)
- レイアウトに依らない平面文書画像の射影歪み補正(テーマセッション5,複合現実感のためのパターン認識・理解)
- データ埋め込みペンに関する基礎的検討
- 初期活字印刷本中の文字の形状解析(テーマセッション1,複合現実感のためのパターン認識・理解)
- 中世英文学資料の認識および解析 : 意義・問題点および予備検討結果(テーマセッション6,文字・文書の認識・理解)
- 文書間の色一様性に基づく文書画像群からの機密パターン抽出(ソフトコンピューティング及び一般)
- 解析的DPマッチングを用いた手書き数字認識(テーマセッション,文字・文書の認識・理解)
- データ埋め込みペン実現に向けたデータ抽出精度の検証(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2),文字認識・文書理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2), 文字認識・文書理解)
- 二値化閾値の補正と罫線形状判定による罫線抽出の高精度化(テーマセッション1,文字・文書の認識・理解)
- 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- e-文書・内部統制向け文書画像認識技術 (特集 研究開発最前線)
- 確率伝搬法を用いた帳票の論理構造認識に関する一方式
- D-12-88 文字列抽出用/図表抽出用の2種類の2値化方式を使用したカラー文書画像レイアウト解析手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-86 混色と薄い色使いにも強いカラー帳票レイアウト復元手法(D-12.パターン認識・メディア理解,一般講演)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 実体を伴うプロアクティブインタフェースによる双方向遠隔コミュニケーション実験(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元(テーマセッション,文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- Part-based文字認識の試み : 手書き数字認識に大局的構造は必要か?(テーマセッション,文字・文書の認識・理解)
- 環境コンテキスト利用による情景画像中文字検出(テーマセッション,文字・文書の認識・理解)
- 特徴追跡と文書画像検索を用いたカメラペンシステム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- 局所特徴量を用いた事例参照に基づく位置同定(一般セッション,文字・文書の認識・理解)
- MIRU2006若手プログラム報告(一般セッション(2),パターン認識・メディア理解のための学習理論とその応用)
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- 多数決型アルゴリズムによる非線形伸縮時系列パターン認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 多数決型アルゴリズムによる非線形伸縮時系列パターン認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 離散型DPと解析的DPの統合による動画像中の物体追跡(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- D-11-65 信頼性の高い文字要素を利用した帳票画像からの行抽出処理(D-11. 画像工学,一般セッション)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- カテゴリー固有変形の線形結合モデルに基づく弾性マッチング法(画像処理,画像パターン認識)
- 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- スキャナで取得した画像におけるポストプリント・パターンのインク色と背景色との混色及びその補正に関する一考察(テーマセッション,文字・文書の認識・理解)
- ステレオ画像圧縮のための視差補償法に関する検討
- 画素を単位とした視差補償に基づくステレオ画像圧縮の検討
- D-12-50 マークパターンが重畳された文字に対する認識方式(D-12.パターン認識・メディア理解,一般セッション)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- テクスチャ領域を含む帳票画像からの罫線抽出(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 付加情報の誤りと誤認識率の関係(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- 付加情報を用いるパターン認識における識別境界移動の効果 : 正規分布に従う人工サンプルを用いた場合の実験的検討
- 離散型DPと解析的DPの統合による動画像中の物体追跡(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 実体を伴うプロアクティブヒューマンインタフェースのためのジェスチャの早期認識・予測に関する検討
- 動作の早期認識およびその予測への応用に関する検討(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 動作の早期認識およびその予測への応用に関する検討(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 学習による映像中の音源同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 学習による映像中の音源同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 文書画像の事例ベース傾き補正の改良(テーマセッション1,文字・文書の認識・理解)
- 事例に基づく文書画像の回転角推定(研究速報)
- 大局的観測と局所的観測の統合による複数人物の無矛盾な位置同定(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- H-031 多峰型解析的DPを用いた動画像中の物体追跡(H分野:画像認識・メディア理解,一般論文)
- 文字仮説の多重生成による帳票画像からの単語抽出方式(テーマセッション1,文字・文書の認識・理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- オンライン手書き文字認識HMMにおける座標情報と方向情報の利用法と効果(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- 区分線形周波数ワープによる話者正規化の検討
- D-12-13 区分線形周波数ワープによる話者正規化の検討
- フレーム間で連続な時間・周波数ワープによる話者正規化の検討
- フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討
- フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討
- フレーム間単調連続周波数ワープによる不特定話者単語音声認識の検討
- 英文数学文書の正解付き文字・記号画像データベース(文書・文字メディアの認識・理解, 一般)
- 英文数学文書の正解付き文字・記号画像データベース(文書・文字メディアの認識・理解, 一般)
- 英文数学文書の正解付き文字・記号画像データベース
- 数学文書データベースの解析(文字とドキュメントの認識・理解)
- 数学文書データベースの解析(文字とドキュメントの認識・理解))
- 座標特徴と方向特徴の選択的利用に基づくオンライン文字認識HMM(画像認識,コンピュータビジョン)
- 筆順変動を表現するHMMとそのオンライン文字認識への応用(画像認識,コンピュータビジョン)
- オートマトン制御付き最適セグメンテーション法とその実環境文字認識への応用(画像処理,画像の認識・理解論文)
- 変量と不変量の組合わせによる文書画像の傾き補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- オンライン文字認識HMMにおける座標特徴と方向特徴の利用方法の検討(テーマセッション4,文字・文書の認識・理解)
- 解析的DPマッチング(パターン認識と理解,画像の認識・理解論文)
- 座標値予測を導入したDPマッチングによるオンライン文字認識(テーマセッション5(オンライン処理),文字・文書の認識・理解)
- パターンマッチングにおける特徴量の非同期化の影響 : オンライン文字認識を例として(テーマセッション5(オンライン処理),文字・文書の認識・理解)
- 部分空間法とDPマッチングに基づくオンライン文字認識手法(テーマセッション(3),文字認識・文書理解)
- フレーム間マッチングを導入したMosaicing-by-Recognition法の検討(テーマセッション(1),文字認識・文書理解)
- 部分空間法とDPマッチングに基づくオンライン文字認識手法(テーマセッション(3), 文字認識・文書理解)
- フレーム間マッチングを導入したMosaicing-by-Recognition法の検討(テーマセッション(1), 文字認識・文書理解)
- 解析的DPマッチングによるパターン認識(テーマセッション,文字認識・文書理解)
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出(画像認識,コンピュータビジョン)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 最適2次元セグメンテーションによる情景内文字抽出(画像認識,コンピュータビジョン)