画像インデクシングを目的としたテキスト領域抽出不要の景観中文字認識 : 階層的認識辞書の適用による処理量の削減(マルチメディアとパターン認識理解,一般)
スポンサーリンク
概要
- 論文の詳細を見る
我々は,画像検索のための景観画像へのインデクス付与を目的として,視点/背景テクスチャ/コントラストの制約を設けずに撮影された景観画像中の文字認識法を提案している.提案法では,文字領域を切り出す必要がなく,シェーディングを伴う文字,立体文字,複雑背景上の文字,切り出しに失敗した傾斜文字,を識別する能力があるが,識別に多大な時間がかかるという課題があった.本稿では,カテゴリを特徴の類似性に基づいて階層的に分類し,各分類パターン(クラス)に対して階層的な辞書を構成することで,提案法の処理量削減を実現する.識別率の測定実験を行い,84%の識別率で処理量を1/20程度に削減できることを確認した.また,日本語キーワード(ひらがな,カタカナを含む)による画像検索精度の測定実験を行い,平均適合率76.8‰平均再現率70.4%を確認した.
- 2004-10-14
著者
-
鈴木 章
日本電信電話(株)nttサイバースペース研究所
-
鈴木 章
Nttサイバースペース研究所
-
荒川 賢一
NTTサイバーコミュニケーション総合研究所
-
伊藤 直己
東日本電信電話株式会社itイノベーション部
-
伊藤 直己
Nttサイバースペース研究所
-
草地 良規
NTTコミュニケーションズ(株)
-
草地 良規
NTTサイバースペース研究所
関連論文
- 構図と色情報を用いた類似画像検索のための低次元グローバル特徴量抽出手法(画像映像処理・システム,ネットワーク,放送,一般)
- 渋滞情報からの旅行時間推計(交通における計測・一般)
- 渋滞情報からの旅行時間推計
- 車載ラインセンサカメラを用いた都市景観データ取得システム
- ラインセンサによる都市データ取得システム
- 長時間の監視映像からの非定常シーケンスの検出(テーマ関連セッション)
- 映像からの人数計測のための幾何不変量に関する検討 (画像工学)
- 映像からの人数計測のための幾何不変量に関する検討 (映像表現&コンピュータグラフィックス・放送技術・メディア工学)
- 同時確率増分符号相関を用いた高速物体検出・識別
- LDM法におけるパラメータ設定法の理論的解析と最適化 : ナンバープレート認識を対象として(パターン認識)
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- 多値テンプレートマッチングを用いたナンバープレート認識法 : 雑音抑制フィルタと文字配置規則の効果的利用(画像・映像処理)
- 一対のラインセンサカメラを用いたナンバプレート位置を基準とした車速計測(画像・映像処理)
- 対数輝度変換と空間周波数強調を適用したマッチトフィルタによるナンバープレート認識法
- 適応的画像選択による輪郭からの物体形状計測
- 類似パターン検索にもとづく逐次一括入力型古文書入力システム
- I-81 幾何的テクスチャ特徴を用いた空中写真からの市街地抽出技術(画像基本特徴量,I.画像認識・メディア理解)
- D-12-16 類似パターン検索にもとづく図形・文字入力方式
- FAX入力手書き図面認識のためのかすれ度合自動評価と線分つなぎ処理制御法の提案
- 特定マーク抽出にもとづくFAX入力帳票の傾斜補正法 : テンプレートに白黒両画素を含む拡張型一般化ハフ変換の適用
- 特定マーク抽出にもとづくFAX入力帳票の傾斜補正法:テンプレートに白黒画素を含む拡張型一般化ハフ変換の適用
- 23-10 図形の位置と白黒反転状態の情報を同時に抽出する一般化ハフ変換
- 23-9 動的2値化法を用いたFAX帳票画像の雑音除去
- 渋滞情報からの旅行時間推計(交通における計測・一般)
- 渋滞情報を用いた旅行時間推計方法
- D-12-99 因子分解法に基づく回転運動画像列からの三次元形状復元(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- IUE(画像理解用標準ソフトウェア)とCalibrated Image Databaseの現状
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- 指紋隆線方向分布とマニューシャ対応付けを用いた指紋照合(画像処理,画像パターン認識)
- ストローク間の距離情報と構造情報とを用いた変型の大きい文字のオンライン認識
- 優先度管理規則と同時生起規則とを用いたオンライン続け字認識におけるストローク結合情報設定法
- オンライン文字認識における差分ストロークを用いた詳細識別
- 携帯型ペン入力インタフェース用個人辞書の学習
- 単語認識系における遺伝アルゴリズムを用いたキー文字選択の最適化
- 回帰手法を用いた文字変形の推定・補正機能の導入による景観中文字認識の高精度化
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 景観画像中の文字候補群による画像インデクシング及び検索技術(画像・映像処理)
- 部分遮蔽と背景変化にロバストなSVRベースの3次元物体姿勢推定(一般セッション,データ工学とメディア理解との融合)
- 部分遮蔽と背景変化にロバストなSVRベースの3次元物体姿勢推定(一般セッション,データ工学とメディア理解との融合)
- サポートベクトル回帰を用いた三次元物体の姿勢推定法(画像認識,コンピュータビジョン)
- サポートベクトル回帰による変形パラメータ推定を利用した景観中文字認識の高精度化(一般セッション(1),人の検出・計測・認識)
- サポートベクトル回帰による変形パラメータ推定を利用した景観中文字認識の高精度化(一般セッション(1),人の検出・計測・認識)
- 最小2乗フィルタの局所的適用による指紋画像の2値化技術 (特集論文 指紋認証システム)
- 距離を用いた点対応付けと変形パターンの生成
- モルフォロジーフィルタの利用による航空写真の影領域の選択的画質改善法
- D-12-15 動的修正識別関数の雑音重畳文字に対する評価
- D-11-69 影領域を選択的に補正する航空写真の画質改善法
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))(CVのためのパターン認識・学習理論の新展開)
- 低品質文字の認識における単語照合の精度推定法
- パターン間照合を利用した文字認識結果の確認修正法
- 文字位置のずれを許容する枠なし筆記住所認識
- 日本語OCRにおける認識結果の一括修正
- 未登録語の出現を考慮した単語認識
- 手書き文字認識の適応型後処理制御
- 文書情報蓄積検索システムの検討
- 手書き住所認識の後処理法
- D-12-44 集団速度の推定に基づく映像からの通過人数測定方法(D-12.パターン認識・メディア理解,一般セッション)
- 背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ文字認識
- 画像インデクシングを目的としたテキスト領域抽出不要の景観中文字認識 : 階層的認識辞書の適用による処理量の削減(マルチメディアとパターン認識理解,一般)
- 指紋隆線方向分布とマニューシャ対応付けを用いた指紋照合技術の開発
- 自動学習形補完法を用いた文字認識後処理
- 線画映像を用いてプライバシー保護に配慮したビジュアルサポートシステム
- 複数情報の統合による看板文字認識
- 景観中文字認識のための対象物適応型複数カメラ視線制御方式
- 対象物適応型カメラ視線制御による景観内文字領域抽出法
- カメラ画像の文字領域判別と適正2値化法
- 景観中文字認識アプリケ-ション用基本機能モジュ-ル開発支援システム
- 撮像斜影歪みを利用した文字平面の単眼視姿勢推定
- 非正読文字が高頻度で発生する単語認識系の性能推定法
- 景観画像中の候補文字集合に対する変形角度推定を用いたキーワード抽出および検索技術
- 複数メンバの視線カメラ映像を利用した体験の記録と有効区間検出
- 血管の接続性を考慮したパノラマ眼底画像の作成
- サポートベクトル回帰による3次元物体の姿勢推定(マルチメディアとパターン認識理解,一般)
- 映像モニタリングのための人物姿勢推定技術 (特集 映像モニタリングサービスを支える画像処理技術)
- 単眼カメラからの三次元顔モデル構築方法に関する検討(複合現実感,仮想都市,及び一般)
- 歩行指導のための足底の部位別荷重パラメータの提案
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- 線画映像コミュニケーションにおける対話ストラテジーと対話特性
- 自動倣い作業ロボットシステムのための断面形状認識
- 関節物体モデルを用いた断面形状認識とGAによるパラメータチューニングの検討 : 溶接ロボットへの適用
- 断面形状変化に適応する関節物体モデルを用いた特徴点認識
- 動画像によるロボットマニピュレータの作業軌道の教示
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- 「遺伝的アルゴリズムを用いた類似文字識別のための特徴選択
- 線画映像コミュニケーションにおける対話ストラテジーと対話特性
- 歩行指導のための足底の部位別荷重パラメータの提案
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- ろう者の緊急通報読取りにおける手話と日本語の相互補完性(福祉工学)
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- メンタルアルゴリズムの概念に基づく避難行動の評価
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- 緊急通報のリスト手話提示における言語間の相互補完性(福祉工学)
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- 映像視聴によるスポーツ動作分析のための画像情報提示方法
- マージン最大化の考え方を導入した遺伝的アルゴリズムによる特徴選択とその文字認識への応用
- D-12-2 群集の流動解析における特徴点マッチング手法の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)