ディジタルカメラのズーム機能を利用した文字認識

概要

論文の詳細を見る
ディジタルスチルカメラを文字認識システムの一部としてとらえ,カメラ機能の制御を撮影時に積極的に利用する文字認識率改善手法を提案する.第一歩としてズーム機能を取り上げ,画質劣化の仕組みを分析し,放射輝度,文字サイズ,焦点距離の三つの要因が認識率に影響することを示す.次に学習データから認識率と上記要因の定量的な関係を明らかにし,得られた最適焦点距離による認識手法を提案し,その有効性を評価する.
社団法人電子情報通信学会の論文
2004-02-01

著者

武川直樹
東京電機大学情報環境学部
萩田紀博
エイ・ティ・アール知能ロボティクス研究所
武川直樹
東京電機大学情報環境学部情報環境工学科
澤木美奈子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
澤木美奈子
NTTコミュニケーション科学基礎研究所
新村貴彦
株式会社NTTデータ技術開発本部
白木善尚
日本電信電話株式会社NTTコミユニケーション科学基礎研究所
新村貴彦
NTTデータ通信(株)・情報科学研究所
武川直樹
東京電機大学
新村貴彦
株式会社nttデータ
白木善尚
日本電信電話株式会社NTTコミュニケーション科学基礎研究所人間情報研究部

関連論文

3人会話の話者交替における発話志向態度分析 : 参与者の発話志向の「場」がつくる話者交替(顔とコミュニケーション(フォーラム顔学2009共済オーガナイズドセッション))
3人会話の話者交替における発話志向態度分析 : 参与者の発話志向の「場」がつくる話者交替(顔とコミュニケーション)
創作した顔アイコンを見たときのfMRI脳計測 : コミュニケーションにおける抽象顔の効果
fMRIによる顔文字と文を読むときの脳活動計測 : 言語・非言語コミュニケーションにおける脳活動を探る
fMRIを用いた顔文字に対する脳活動計測 : 電子的コミュニケーションにおける顔の効果
4.食べる(生活に役立つメディア処理-料理行動を科学する-)
脳機能解析を用いた対人コミュニケーションにおけるメッセージの効果の検討
顔文字に対する脳活動
漢字による感情表現を付加した文を読むときの脳活動 : 機能的MRIを用いた(笑)(涙)の脳活動計測
似顔絵の面白さ『じわじわ』,『Aha!』を感じる過程の心理分析と脳活動分析(HCGシンポジウム)
創作した抽象顔アイコンを見たときの脳活動 : コミュニケーションにおける抽象顔の効果
3人会話の視線と発話マインド分析 : 話者と聞き手の発話マインドは話者交替に際しどう調整されるか?(視線とコミュニケーション,HCGシンポジウム)
3人のテーブルトークにおける視線,食事動作,発話交替の分析 : 会話と食事動作はどう制御されるか?(言語・非言語コミュニケーション〜言葉と身体の相互作用〜)
ベクトル量子化によるマルチスペクトル画像特徴表現と画像検索
ベクトル量子化によるマルチスペクトル画像特徴と表現と画像検索
擬人化エージェントの印象操作のための視線制御方法(インタラクション技術の革新と実用化)
D-7-7 診断サポートに向けた臨床データの健康度推定(D-7. MEとバイオサイバネティックス,一般セッション)
ベクトル量子化によるマルチスペクトル画像検索(画像処理,画像パターン認識)
社会科学のアプローチに基づくコミュニケーションロボット・擬人化エージェントの設計に向けて : 人間観察によってデザインされたロボットは「不気味の谷」を渡れるか?
多人数エージェントの発話交替により現れる雰囲気の分析 : 気まずい会話・仲良し会話(コミュニケーション支援,一般)
多人数エージェントの発話交替により現れる雰囲気の分析 : 気まずい会話・仲良し会話(コミュニケーション支援,一般)
ユーザ行動を誘導するための擬人化エージェントの対人印象操作・非言語行動表出モデル(ヴァーバル・ノンヴァーバル・コミュニケーション,ヒューマンコミュニケーション〜人間中心の情報環境構築のための要素技術〜論文)
fMRIによるHAIのコミュニケーション設計(深化するHAI:ヒューマンエージェントインタラクション)
人と擬人化エージェントのインタラクション : 脳活動からみた分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
ランレングス補正を用いた画質劣化にロバストな特徴抽出法(画像処理, 画像パターン認識)
歩行動作特性からの年齢層の推定
ユーザとのコミュニケーションにおける擬人化エージェントの視線移動制御
劣化推定に基づいた辞書の自動選択による本棚画像中の文字認識
テンプレート学習による本棚画像中の文字認識
複数情報が重畳した尺八譜認識に関する一検討
周囲文字を含んだ参照パターンによる本棚画像中の文字認識
辞書の自動選択による本棚画像中の文字認識
変形推定に基づいた参照パターンの自動選択による文字認識
複数情報が重畳した文字列認識の一検討 : 尺八譜認識の例
D-12-47 多重解像度表現を利用した画像の特徴量抽出(D-12. パターン認識・メディア理解, 情報・システム2)
オクルージョン推定に基づく領域分割ベースステレオビジョン : 領域統合による奥行きの傾斜の推定(一般セッション3(コンピュータビジョン),文字・文書の認識・理解)
ディジタルカメラのズーム機能を利用した文字認識
2点補正による簡易キャリブレーションを実現した視線測定システム
視線測定による遠隔地映像対話の解析
視線測定による遠隔地映像対話の解析
コミュニケーションにおける視線の役割 : 視線が伝える意図・気持ち
焦点距離制御を用いた情景内文字認識
焦点距離制御を用いた情景内文字認識
焦点距離制御を用いた情景内文字認識
流し目の効果 : 視線と顔方向から受ける印象の評価
目で操作するコンピュータのための視線測定システム (特集人間情報科学が切り拓くコミュニケーションの未来)
撮影距離の変化に対する情景内文字の認識特性
D-12-6 ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法
ランレングス補正を用いた画質劣化にロバストな特徴抽出法
ランレングス補正を用いた画質劣化にロバストな特徴抽出法
ランレングス補正を用いた画質劣化にロバストな特徴抽出法
眼球形状モデルに基づく視線測定システム : 視線入力デバイスの実現に向けて
ビジョン技術によるコミュニケーション環境理解--視線を用いたコミュニケーション支援 (特集論文1 人にやさしい対話型コンピュータ)
「パターン認識・理解」から「パターン認識・メディア理解」へ
発話志向態度の表出・理解と発話調整に基づく話者交替分析 : 3人会話における「話したい/聞きたい」態度表出の効用(言語コミュニケーションとそのフィールド)
一様範囲の推定を用いたテクスチャ画像の領域分割
多値画像中の文字列切り出しに関する一検討
劣化文字にロバストな識別関数の学習に関する検討
視線と表情を持つ擬人化エージェントのインタラクションによる印象変化(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
幼児の描く顔の形状と色の分析 : 「顔だけ」から「楽しい顔」へ(コミュニケーションにおける「顔」,HCGシンポジウム)
多人数映像会話における話し手の身振りとアクティビティの関係 : 視線一致と不一致環境により会話の質はどのように変わるか?(マルチモーダルコミュニケーション,HCGシンポジウム)
○△□の語らい : エージェントの形状と動作の抽象的表現(セッション5,新領域創造インタラクション)
視線虚一致映像装置を用いた発話交替の行動分析(マルチメディア仮想環境基礎,及び一般,HCGシンポジウム)
ヒューマン・コンピュータ・インタラクション中の脳活動計測(一般講演1A)
3次元結晶格子モデルを用いた結晶粒界の抽出
結晶構造の分析に適用可能な三次元ウェーブレットの構築(ディジタル信号処理)
特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識(画像認識,コンピュータビジョン)
画質劣化文字認識のためのカテゴリに依存した特徴抽出法
方向不整合のある多人数映像会話システムは発話行動に影響を与えるか? : 視線による発話交替のビデオ分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
複数人の映像会話における空間の整合性と人の補償行動 : ノンバーバル情報のコミュニケーションにおける役割
複数人の映像会話における空間の整合性と人の補償行動 : ノンバーバル情報のコミュニケーションにおける役割(顔とコミュニケーション及び一般)
A-14-7 視線に基づく映像対話の分析 : 行動分析的アプローチ(A-14. ヒューマンコミュニケーション基礎, 基礎・境界)
店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現
ユビキタスマーケットプラットフォームにおける店舗内外連携による顧客案内動作の実現
DP-1-3 異種ロボット連携による買い物支援(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
DP-1-2 ユビキタスネットワークロボット研究開発プロジェクト : 全体像と中間成果総括(DP-1.ネットワークロボットからクラウドネットワークロボットヘ,パネルセッション,ソサイエティ企画)
対面の複数人対話を撮影対象とした対話参加者の視線に基づく映像切替え方法とその効果(グループウェア)
複数人対話シーンの映像編集のための対話参加者の視線に基づく映像切り替え方法とその効果(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
A-14-6 対話参加者の視線に基づく映像切り替え方法とその効果(A-14. ヒューマンコミュニケーション基礎)
デザイン処理された新聞見出し画像の文字認識法
補完類似度に基づく新聞見出し文字の領域抽出と認識
補完類似度による劣化印刷文字認識
補完類似度による低品質文字認識--文字を認識するコンピュ-タ (特別企画ヒュ-マノイドテクノロジ&サイエンス)
店舗環境内の停留位置系列から推定した顧客の興味に基づく誘導の実現(ライフサポート,グループウェアとネットワーク,ライフログ活用技術,一般)
コミュニケーションロボットによる領域参照のための直示的インタラクションのモデル化
複数の案内ロボットが連携してサービス提供するネットワークロボットシステムの実現
twitterを用いた即応性の高いQ&A仲介エージェントの提案(一般セッション(1),クラウドでつながるロボットサービス)
ロボットの能動的接触は人間のモチベーションを上げるか(エージェントデザイン,人とエージェントのインタラクション論文)
コミュニケーションロボットのための発話とジェスチャのアサインパターンの抽出とその発展的開発手法の提案(対話生成,人とエージェントのインタラクション論文)
人々との身体的なインタラクションを行う小型ロボットのための慣性センサを用いた個人同定手法の確立(ユーザ状態推定,人とエージェントのインタラクション論文)
ロボット発話の冗長性制御による指示物体認識性能向上への寄与
店舗内での顧客の停留領域系列に基づいたロボットからの商品推薦(知能ロボット,ライフログ処理技術とその活用システム論文)
クラウドによるロボットの発話とジェスチャのアサインパターンの抽出とその発展的開発手法(地理空間情報とロボットと人と)
対話行動認識プラットフォーム
DP-1-3 多地点を連携して動くロボットサービス実証実験 : ユビキタスネットワークロボット・プラットフォーム(DP-1.クラウドネットワークロボットのワイガヤ実験場の実現に向けて,パネルセッション,ソサイエティ企画)
コミュニケーションロボットによる道案内 : ジェスチャの有用性と発話タイミングのモデル化(人工知能,データマイニング)
複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
顧客の軌跡データを利用した実購買行動解析による購買・非購買推定(行動解析,ユーザ属性情報,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
複数パンチルトカメラによる高解像度3次元映像撮影システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
Speakership に着目した共食参与者の戦略的な発話と摂食の行動分析

ディジタルカメラのズーム機能を利用した文字認識

スポンサーリンク

概要

著者

関連論文

スポンサーリンク