焦点距離制御を用いた情景内文字認識
スポンサーリンク
概要
- 論文の詳細を見る
デジタルカメラによる文字画像の撮影では,カメラ制御パラメータの変化が文字認識システムの認識率に影響する.情景内文字認識では焦点距離と照明条件が文字認識精度に影響を与える.薄明かりの中で撮影する場合は,特に認識率が最適になるような焦点距離を求めることが難しくなる.この問題を解決するために,照明変動に対して適切な焦点距離を求める方法を提案する.この方法は,明るさや撮影距離の異なるデータから最適焦点距離を学習したもので,未知のデータについて有効性を確認した.20種類のフォントについて調査した結果,単純にズームをかけて画像を大きくした場合より,本方法で撮影した画像の認識率が高かった.
- 社団法人電子情報通信学会の論文
- 2002-03-07
著者
-
萩田 紀博
エイ・ティ・アール知能ロボティクス研究所
-
武川 直樹
東京電機大学情報環境学部情報環境工学科
-
萩田 紀博
ATRメディア情報科学研究所
-
武川 直樹
日本電信電話株式会社NTTCS基礎研究所
-
澤木 美奈子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
澤木 美奈子
NTTコミュニケーション科学基礎研究所
-
新村 貴彦
株式会社NTTデータ技術開発本部
-
白木 善尚
日本電信電話株式会社NTTコミユニケーション科学基礎研究所
-
新村 貴彦
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
-
新村 貴彦
NTTデータ通信(株)・情報科学研究所
-
新村 貴彦
株式会社nttデータ
-
白木 善尚
日本電信電話株式会社NTTコミュニケーション科学基礎研究所 人間情報研究部
-
武川 直樹
日本電信電話株式会社 NTTCS基礎研究所
関連論文
- 確率的予測に基づく人流計測(一般セッション(4))
- D-12-102 複数視点監視カメラを用いた動的な見え方学習法(D-12.パターン認識・メディア理解,一般講演)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
- 擬人化エージェントの印象操作のための視線制御方法(インタラクション技術の革新と実用化)
- TV会議用フレーム間符号化方式の検討
- D-7-7 診断サポートに向けた臨床データの健康度推定(D-7. MEとバイオサイバネティックス,一般セッション)
- 体験Webと五感メディア(五感インタフェース)
- ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
- マルチメディア俳句による共感度の増幅効果について : 印象評価実験に基づく予備検討
- マルチメディア俳句による共感度の増幅効果について : 印象評価実験に基づく予備検討
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
- 歩行動作特性からの年齢層の推定
- ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
- 劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
- テンプレート学習による本棚画像中の文字認識
- 複数情報が重畳した尺八譜認識に関する一検討
- 周囲文字を含んだ参照パターンによる本棚画像中の文字認識
- 辞書の自動選択による本棚画像中の文字認識
- 変形推定に基づいた参照パターンの自動選択による文字認識
- 複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
- ディジタルカメラのズーム機能を利用した文字認識
- 2点補正による簡易キャリブレーションを実現した視線測定システム
- 視線測定による遠隔地映像対話の解析
- 視線測定による遠隔地映像対話の解析
- コミュニケーションにおける視線の役割 : 視線が伝える意図・気持ち
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 焦点距離制御を用いた情景内文字認識
- 流し目の効果 : 視線と顔方向から受ける印象の評価
- 目で操作するコンピュータのための視線測定システム (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 撮影距離の変化に対する情景内文字の認識特性
- D-12-6 ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- ランレングス補正を用いた画質劣化にロバストな特徴抽出法
- 眼球形状モデルに基づく視線測定システム : 視線入力デバイスの実現に向けて
- ビジョン技術によるコミュニケーション環境理解--視線を用いたコミュニケーション支援 (特集論文1 人にやさしい対話型コンピュータ)
- 「パターン認識・理解」から「パターン認識・メディア理解」へ
- S2-4 背景予測を導入したTV会議用符号化方式
- テレビ会議用フレーム間符号化装置
- ビデオ符号化用LSI化D/D変換回路
- 7-7 LSIを用いたフレーム内符号化装置の構成
- 7-6 6.3Mb/sフレーム間符号化装置の構成
- テレビ会議画像用1.5Mb/sフレーム間符号化方式の構成
- LSI向きフレーム内直接予測符号化方式の構成
- 7-9 フレーム間符号化用プレフィルタの特性
- 駒落し符号化の主観評価実験(視覚と画質)
- 動画像のフィールド処理に関する検討
- 10-5 移動量を用いたTV画像の予測と補間の検討
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- 多値画像中の文字列切り出しに関する一検討
- 劣化文字にロバストな識別関数の学習に関する検討
- [特別講演]インタラクション・メディアとしての文字・文書に対する認識・理解研究とは
- 非西欧音楽スタイルに学ぶ音楽知育メディアの試み
- 体験Webのための五感メディア技術(招待講演2)(高臨場感ディスプレイフォーラム2002)
- 体験 Web のための五感メディア技術
- 体験Webのための五感メディア技術
- コミュニケーション・メディアとしての俳句を通じた共感形成に関する一検討
- 時間長モデルを用いた自動ラベリング
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- まつしゅるーむの世界 : 環境知能の実現
- 多重スケールフィルタを用いたカラーテクスチャ画像の領域分割
- LVQにおける誤認識パターンを重視した学習パターン選択法
- 2L-6 マルチテンプレート辞書のLVQ学習窓の検討
- 特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
- 画質劣化文字認識のためのカテゴリに依存した特徴抽出法
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
- ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
- DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
- システム応答文のための韻律分析
- 視線の機能に着目した映像切り替え規則とその効果 : 人に分かりやすい映像生成を目指して(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- A-15-9 視線情報に基づく映像切り替え規則とその評価
- デザイン処理された新聞見出し画像の文字認識法
- 補完類似度に基づく新聞見出し文字の領域抽出と認識
- 補完類似度による劣化印刷文字認識
- 低品質文字の認識手法とその応用に関するサーベイ(PRPRサーベイシリーズ)
- 補完類似度による低品質文字認識--文字を認識するコンピュ-タ (特別企画 ヒュ-マノイドテクノロジ&サイエンス)
- 多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定
- 店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
- コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
- 複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
- twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
- ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
- 擬人化エージェントとの音声対話時におけるユーザの非言語動作からの難/易及び興味/退屈の推定(ユーザ状態推定,人とエージェントのインタラクション論文)
- コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
- 人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
- ロボット発話の冗長性制御による指示物体認識性能向上への寄与
- 店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
- クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
- 対話行動認識プラットフォーム
- DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
- ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
- コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)