サポートベクトル回帰による変形パラメータ推定を利用した景観中文字認識の高精度化(一般セッション(1),人の検出・計測・認識)
スポンサーリンク
概要
- 論文の詳細を見る
近年,文字列をキーとした画像検索のためのインデクシング等を目的として,景観中文字認識の研究が活発である.景観中文字認識とは,カメラで撮像した一般的な自然画像から文字情報を抽出し識別する技術である.そのため,複雑な背景の下に存在し,かつ,撮像方向による幾何的歪みが発生している文字を認識しなくてはならない.この問題を解決するために,本研究では,撮像方向等による幾何的歪みをサポートベクトル回帰を用いて推定し,その歪みを補正した後に識別を行う手法を提案する.歪みを補正した場合は,補正しない場合に比べ識別精度が向上することを実験的に示す.
- 社団法人電子情報通信学会の論文
- 2006-05-18
著者
-
鈴木 章
日本電信電話(株)nttサイバースペース研究所
-
荒川 賢一
日本電信電話株式会社NTTサイバースペース研究所
-
安野 貴之
NTT サイバースペース研究所
-
安野 貴之
日本電信電話株式会社
-
安野 貴之
NTTサイバースペース研究所
-
安藤 慎吾
日本電信電話株式会社NTTサイバースペース研究所
-
安野 貴之
日本電信電話(株)
-
安藤 慎吾
日本電信電話(株)nttサイバースペース研究所
-
草地 良規
NTTコミュニケーションズ(株)
-
草地 良規
日本電信電話株式会社NTTサイバースペース研究所
-
安野 貴之
日本電信電話(株)nttサイバースペース研究所
関連論文
- 構図と色情報を用いた類似画像検索のための低次元グローバル特徴量抽出手法(画像映像処理・システム,ネットワーク,放送,一般)
- 渋滞情報からの旅行時間推計(交通における計測・一般)
- 渋滞情報からの旅行時間推計
- 車載ラインセンサカメラを用いた都市景観データ取得システム
- ラインセンサによる都市データ取得システム
- 小人数・非熟練オペレータによる広域な市街地空間モデルの自動構築システム(オーガナイズドセッション(1) : 街の計測とモデリング)
- 空間分割による広範囲実時間人体の3次元形状復元(一般セッション2)
- LI_007 MCMC法に基づく3次元環境情報を用いた複数人物追跡(I分野:画像認識・メディア理解)
- 映像時空間内での変化領域を特徴量とする監視映像からの非定常度推定(テーマセッション(2),人の検出・計測・認識)
- 長時間の監視映像からの非定常シーケンスの検出(テーマ関連セッション)
- エッジ点の段階的統合に基づくレーザレンジデータからの市街地モデル構築(画像情報)
- 車両運動投影モデルに基づく全方位画像系列からの市街地空間の3次元構造復元(街を観る)
- 空撮映像の分割と統合による広域市街地空間モデルの自動構築(街を観る)
- 魚眼投影モデルに基づく画像系列からの平面運動と3次元形状の復元(画像認識,コンピュータビジョン)
- 空撮映像からの広域な市街地空間モデルの構築 : 5000軒規模の自動構築実験(一般セッション(1))(データマイニングとパターン認識・メディア理解)
- 空撮画像系列を利用した市街地構造の空間データ復元(映像・マルチメディアとパターン認識・理解)
- プロジェクタ・カメラシステムにおける射影変換行列と直線パターン検出に基づく複数平面の検出
- プロジェクタを用いた動的実環境における観測位置依存映像提示
- 透視投影画像と平行投影画像を利用した3次元フロー推定(画像処理,画像パターン認識)
- HCIのための赤外線カメラを用いた3次元追跡手法
- 決定木を利用した交通渋滞予測手法に関する考察
- 決定木を利用した交通渋滞予測手法に関する考察(セッション6,ITS情報処理・一般)
- 決定木を利用した交通渋滞予測手法に関する考察(セッション6)(ITS情報処理・一般)
- 同時確率増分符号相関を用いた高速物体検出・識別
- LDM法におけるパラメータ設定法の理論的解析と最適化 : ナンバープレート認識を対象として(パターン認識)
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- 多値テンプレートマッチングを用いたナンバープレート認識法 : 雑音抑制フィルタと文字配置規則の効果的利用(画像・映像処理)
- 一対のラインセンサカメラを用いたナンバプレート位置を基準とした車速計測(画像・映像処理)
- 対数輝度変換と空間周波数強調を適用したマッチトフィルタによるナンバープレート認識法
- リアルタイム検出可能な動画向けモバイル電子透かし
- 単一周波数平面スペクトル拡散を利用した時間同期外し耐性をもつ動画電子透かし(情報セキュリティ応用)
- 携帯端末上における幾何補正のためのリアルタイム矩形追跡手法(知的生産活動における情報アクセス制御技術及び一般)
- LJ_009 単一周波数平面スペクトル拡散を利用した時間同期外し耐性を持つ動画電子透かし(J分野:グラフィクス・画像)
- 経路案内情報がナビゲーションに及ぼす影響(空間認知と経路選択)(空間情報認知特性の基礎と応用論文)
- ひも状柔軟物体の三次元計測による入力インタフェース
- Augmented Deskインタフェースにおける3次元インタラクション環境の構築(オフィスインフォメーションシステム及び一般)
- 類似パターン検索にもとづく逐次一括入力型古文書入力システム
- I-81 幾何的テクスチャ特徴を用いた空中写真からの市街地抽出技術(画像基本特徴量,I.画像認識・メディア理解)
- D-12-16 類似パターン検索にもとづく図形・文字入力方式
- 映像時空間内での変化領域を特徴量とする監視映像からの非定常度推定(テーマセッション(2),人の検出・計測・認識)
- 渋滞情報からの旅行時間推計(交通における計測・一般)
- コミュニティにおけるヒューマンインタラクション(人とコミュニティ)
- 1-3 ビデオ制作における遠隔ブレビュー機能の実現
- 映像制作における遠隔協調作業の実証実験
- 渋滞情報を用いた旅行時間推計方法
- D-12-99 因子分解法に基づく回転運動画像列からの三次元形状復元(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-16-16 本人情報を反映した3Dキャラクタの3次元共有仮想空間への適用
- 人物顔形状を反映した3Dデフォルメキャラクタ生成システムの構築
- 人物顔形状を反映した3Dデフォルメキャラクタ生成システムの構築
- 人物顔形状を反映した3Dデフォルメキャラクタ生成システムの構築
- A-16-9 3Dキャラクタのデフォルメ表現方法に関する一検討
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- 指紋隆線方向分布とマニューシャ対応付けを用いた指紋照合(画像処理,画像パターン認識)
- ストローク間の距離情報と構造情報とを用いた変型の大きい文字のオンライン認識
- 優先度管理規則と同時生起規則とを用いたオンライン続け字認識におけるストローク結合情報設定法
- オンライン文字認識における差分ストロークを用いた詳細識別
- 携帯型ペン入力インタフェース用個人辞書の学習
- 回帰手法を用いた文字変形の推定・補正機能の導入による景観中文字認識の高精度化
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 景観画像中の文字候補群による画像インデクシング及び検索技術(画像・映像処理)
- 部分遮蔽と背景変化にロバストなSVRベースの3次元物体姿勢推定(一般セッション,データ工学とメディア理解との融合)
- 部分遮蔽と背景変化にロバストなSVRベースの3次元物体姿勢推定(一般セッション,データ工学とメディア理解との融合)
- サポートベクトル回帰を用いた三次元物体の姿勢推定法(画像認識,コンピュータビジョン)
- サポートベクトル回帰による変形パラメータ推定を利用した景観中文字認識の高精度化(一般セッション(1),人の検出・計測・認識)
- サポートベクトル回帰による変形パラメータ推定を利用した景観中文字認識の高精度化(一般セッション(1),人の検出・計測・認識)
- 最小2乗フィルタの局所的適用による指紋画像の2値化技術 (特集論文 指紋認証システム)
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))(CVのためのパターン認識・学習理論の新展開)
- センサエンハンストロボットシステムにおけるマルチモーダル教示アドバイザの提案 : 基本コンセプトとウェアラブルインタフェースの実現例
- 画像インデクシングを目的としたテキスト領域抽出不要の景観中文字認識 : 階層的認識辞書の適用による処理量の削減(マルチメディアとパターン認識理解,一般)
- 指紋隆線方向分布とマニューシャ対応付けを用いた指紋照合技術の開発
- 線画映像を用いてプライバシー保護に配慮したビジュアルサポートシステム
- 景観画像中の候補文字集合に対する変形角度推定を用いたキーワード抽出および検索技術
- 複数メンバの視線カメラ映像を利用した体験の記録と有効区間検出
- 車体シーリングロボットのための高速倣い視覚センシングシステムの開発
- 血管の接続性を考慮したパノラマ眼底画像の作成
- CCD・CMOSカメラ技術入門, 竹村裕夫(著), コロナ社, 2008-04, A5判, 定価(本体2,800円+税)
- サポートベクトル回帰による3次元物体の姿勢推定(マルチメディアとパターン認識理解,一般)
- 空撮画像系列を利用した市街地構造の空間データ復元(映像・マルチメディアとパターン認識・理解)
- 空撮画像系列を利用した市街地構造の空間データ復元(映像・マルチメディアとパターン認識・理解)
- 映像モニタリングのための人物姿勢推定技術 (特集 映像モニタリングサービスを支える画像処理技術)
- 単眼カメラからの三次元顔モデル構築方法に関する検討(複合現実感,仮想都市,及び一般)
- 歩行指導のための足底の部位別荷重パラメータの提案
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- 線画映像コミュニケーションにおける対話ストラテジーと対話特性
- 「遺伝的アルゴリズムを用いた類似文字識別のための特徴選択
- 線画映像コミュニケーションにおける対話ストラテジーと対話特性
- 歩行指導のための足底の部位別荷重パラメータの提案
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- ろう者の緊急通報読取りにおける手話と日本語の相互補完性(福祉工学)
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- メンタルアルゴリズムの概念に基づく避難行動の評価
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- プロジェクタを用いた動的実環境における観測位置依存映像提示(「投影型インタフェース」特集)
- 緊急通報のリスト手話提示における言語間の相互補完性(福祉工学)
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- 映像視聴によるスポーツ動作分析のための画像情報提示方法
- マージン最大化の考え方を導入した遺伝的アルゴリズムによる特徴選択とその文字認識への応用