特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
スポンサーリンク
概要
- 論文の詳細を見る
マルチフォント認識などで用いられる文字線の方向情報などを抽出した幾何学的特徴は,変形に対する耐性はあるが画質劣化には脆弱である.本論文では,上記問題点を解決するため,特徴補正処理に基づくカテゴリーに依存した特徴抽出法を提案する.提案手法は,まず入力画像と各カテゴリーのテンプレートを比較することにより,入力画像の劣化程度を推定する.次いで,推定結果を用いて特徴値を補正することにより,画質劣化に起因する特徴値の変動を吸収する.今回,提案手法を画質劣化と変形が混在する映像中文字認識へ適用した.映像から切り出された文字サンプルを用いた認識実験において,提案手法により幾何学的特徴の画質劣化に対する耐性を向上可能であることを示す.
- 社団法人電子情報通信学会の論文
- 2004-08-01
著者
-
萩田 紀博
エイ・ティ・アール知能ロボティクス研究所
-
萩田 紀博
Atr知能ロボティクス研究所
-
森 稔
東京女子医科大学ireiims:nttコミュニケーション科学基礎研究所
-
澤木 美奈子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
森 稔
日本電信電話株式会社コミュニケーション科学基礎研究所
-
澤木 美奈子
NTTコミュニケーション科学基礎研究所
-
森 稔
日本電信電話株式会社nttコミュニケーション科学基礎研究所
関連論文
- 移動軌跡を用いた歩行者間の人間関係の推定(テーマ関連セッション8,コンピュータビジョンとパターン認識のための学習理論)
- 移動軌跡を用いた歩行者間の人間関係の推定(テーマ関連セッション8)
- ネットワークロボット知能化技術
- マルチメディアコンピューティング〔VI・完〕 : 知的メディア処理
- ロボット漫才 : 社会的受動メディアとしての二体のロボットの利用
- 時間・空間的にまばらな多視点画像を用いた個人識別のための動的な見え方学習法
- まばらに配置された複数視点の画像からのパラメトリック固有空間学習法 : 円筒近似された人物頭部モデルによる見え方の補間(テーマセッション(2))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- 擬人化エージェントの印象操作のための視線制御方法(インタラクション技術の革新と実用化)
- 子どもの音楽創作意欲を高めるための「音に触って聞く」作曲システムの提案(エンタテインメントコンピューティング)
- D-7-7 診断サポートに向けた臨床データの健康度推定(D-7. MEとバイオサイバネティックス,一般セッション)
- 遠隔存在感メディアとしてのアンドロイド・ロボットの可能性(ヒューマンインタフェース基礎,インタラクションの理解とデザイン)
- 視線計測を用いた商業施設における来店者行動の分析(一般講演,生活メディア)
- 半自律型コミュニケーションロボットの開発(エージェントデザイン,人とエージェントのインタラクション論文)
- Breathy/whispery発声の音響特徴と音声コミュニケーションにおける役割(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 状況依存モデルを用いた異常行動の検出(一般,膨大なデータから学ぶもの)
- 監視カメラ映像におけるGPS端末携帯ユーザの同定と追跡(一般セッション11)
- Stealth Vision : 被写体のプライバシを保護する映像獲得方式(テーマセッション(3))(ユビキタスコンピューティングのためのパターン認識・理解)
- 1. ネットワークロボット概論(ネットワークロボット最前線)
- グループウェアにおける作業スペース共有方式がユーザ間の社会的関係構築に及ぼす影響 : Sense Web の評価事例
- IrID : 赤外線LEDによる小型位置取得装置の実装と運用(ユビキタスコンピューティング,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- インタラクティブ・アニメーション・システムにおけるぬいぐるみ型ロボットの活発度がユーザに及ぼす影響
- 語彙の引き込み:ロボットは人間の語彙を引き込めるか?
- ヒューマノイドロボットの Subtle Expressions による感情モーション修飾手法
- マルチメディア俳句による共感度の増幅効果について : 印象評価実験に基づく予備検討
- マルチメディア俳句による共感度の増幅効果について : 印象評価実験に基づく予備検討
- 複数カメラ切り替えに基づくコミュニケーションロボットの遠隔操作インタフェース(実証実験,HRI)
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 変形推定に基づいた参照パターンの自動選択による文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- ユビキタス環境における体験の記録と共有(ユビキタス社会の実現特集号)
- ユビキタス環境下における体験共有システムの構築(位置・インタラクション(1))
- ユビキタス環境下における体験共有システムの構築
- 実データの分類による人とロボットの触覚インタラクションの典型パターン抽出(ヒューマンモデル,人とエージェントのインタラクション論文)
- ディジタルカメラのズーム機能を利用した文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 撮影距離の変化に対する情景内文字の認識特性
- D-12-6 ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- 「パターン認識・理解」から「パターン認識・メディア理解」へ
- 多値画像中の文字列切り出しに関する一検討
- 劣化文字にロバストな識別関数の学習に関する検討
- ネットワークロボットのフィールド実験
- 簡略化した音情報によるプライバシー保護型の生活状況識別(生活メディア(1):コミュニケーション,日常生活におけるメディア技術)
- RJ-005 コミュニケーションロボットの印象制御のためのジェスチャ変形手法(ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 状況依存モデルを用いた異常行動の検出(一般,膨大なデータから学ぶもの)
- 非西欧音楽スタイルに学ぶ音楽知育メディアの試み
- 非西欧音楽スタイルに学ぶ音楽知育メディアの試み
- 体験Webのための五感メディア技術(招待講演2)(高臨場感ディスプレイフォーラム2002)
- 体験 Web のための五感メディア技術
- 体験Webのための五感メディア技術
- 体験Webのための五感メディア技術
- Augmented Music Composition Support as Active Mining
- Augmented Music Composition Support as Active Mining
- コミュニケーション・メディアとしての俳句を通じた共感形成に関する一検討
- 人にやさしい対話型コンピュータの実現を目指して (特集論文1 人にやさしい対話型コンピュータ)
- インタラクションに基づく体験共有コミュニケーション(ユビキタスメディアによるセンサーネットワーク-インフラとしてのCV)
- 外部観測可能な非言語行動による興味傾向判別の提案
- 装着型体験記録装置による対話インタラクションの判別機能実装と評価
- ユビキタス体験メディアによるインタラクション・コーパス構築(一般セッション(1))(ユビキタスコンピューティングのためのパターン認識・メディア理解,一般)
- ATRメディア情報科学研究所・知能ロボティクス研究所の代表的研究(けいはんな学研セッション,特別企画講演)
- ATRメディア情報科学研究所・知能ロボティクス研究所における研究プロジェクト(けいはんな学研セッション,特別企画講演)
- RJ-008 ヘルスケアロボットへのパーソナリティ付与による説得効果(J分野:ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 対話ロボットの反応時間と反応遅延時における間投詞の効果
- 特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
- 画質劣化文字認識のためのカテゴリに依存した特徴抽出法
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
- ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
- DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- デザイン処理された新聞見出し画像の文字認識法
- 補完類似度に基づく新聞見出し文字の領域抽出と認識
- 補完類似度による劣化印刷文字認識
- 補完類似度による低品質文字認識--文字を認識するコンピュ-タ (特別企画 ヒュ-マノイドテクノロジ&サイエンス)
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
- コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
- 複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
- twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
- ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
- コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
- 人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
- 対話行動認識プラットフォーム
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)