トラジェクトリ特徴量に基づく単語読唇(画像認識,コンピュータビジョン)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では視覚情報を利用して人間の発話内容を理解する,いわゆる読唇において高認識率が得られるトラジェクトリ特徴量を提案する.トラジェクトリ特徴量は,口唇領域または口内領域より計測できる面積とアスペクト比の二つの特徴量をもとに,発話により生じる2特徴量の時間的変化を口形の軌道として表現される.認識はトラジェクトリ特徴量に二次元DPマッチングを適用する.(1)車椅子制御用10単語と(2)数字10単語の動画像において,これまで提案されている特徴量とトラジェクトリ特徴量の比較実験を行った結果,従来特徴量で最も高い認識率は(1)92.5%,(2)72.0%であったのに対し,トラジェクトリ特徴量は(1)99.5%,(2)83.5%の高認識率を得た.また処理速度,発話速度を考慮して擬似的にフレームレートを変更して比較実験を行った結果,従来の特徴量で最も高い認識率は69.5%であるのに対し,トラジェクトリ特徴量では98.0%と高い認識率であった.これより,トラジェクトリ特徴量は発話速度に対してロバストであり,かつ高い認識精度を有することを確認した.
- 2007-04-01
著者
関連論文
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討 (ヒューマン情報処理)
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討 (パターン認識・メディア理解)
- 複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション,手,顔,身体表現の認識,理解)
- 複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション4)
- 携帯電話・ネットワークを利用した個人用の防犯・生活支援システム
- CLMによるディジタル画像の回転, 拡大・縮小とその性能評価
- Complex-Log Mapping手法によるディジタル画像の回転,拡大・縮小処理について : 画像情報記録
- Complex-Log Mapping手法によるディジタル画像の回転,拡大・縮小処理について
- エレベータによるフロア間移動が可能な音声操作型電動車いす(肢体障害・介護,HCGシンポジウム)
- 特徴選択と複数のサブトラッカによるMean Shift追跡 (音声)
- 特徴選択と複数のサブトラッカによるMean Shift追跡 (パターン認識・メディア理解)
- 鳥取大学工学部電気電子工学科における教育改革と評価
- スケジューリングによる待機電力削減機能を持つ多機能コンセントの開発
- 音声命令による電動車椅子の操作(福祉と音声処理,一般)
- 音声命令による電動車椅子の操作(福祉と音声処理,一般)
- 自己組織化マップを用いたハーブ種の判別
- 前向きおよび後向き線形予測法を用いた雑音下での指数減衰信号の周波数推定
- 前向きおよび後向き線形予測法を用いた雑音下での指数減衰信号の周波数推定
- 前向きおよび後向き線形予測法を用いた雑音下での指数減衰信号の周波数推定
- SnO_2薄膜センサのホルムアルデヒド検出における適応線スペクトル強調器の応用
- 自己組織化マップを用いたハーブ種および混合ガス種の判別 (第19回センシングフォーラム--センシング技術の新たな展開と融合 資料) -- (セッションTC2 センサ・情報処理)
- 水晶振動子を用いたハーブ種識別システムの構築
- インターネットを利用したホームセキュリティシステムの構築
- 正弦波モデルによる信号のパラメータ推定について
- 正弦波モデルによる信号のパラメータ推定について
- 正弦波モデルによる信号のパラメータ推定について
- 音源方向推定と音源分離手法を用いた音声認識
- インターフェイス・サーバを利用したセキュリティーシステムの構築
- 信号を構成する複数の正弦波の周波数及び振幅・位相の推定について
- 汎用MESFETの多機能センサへの応用
- 画像情報を用いた単語発話区間抽出処理とその実時間単語認識システムへの応用
- MESFETを利用した多機能センサ
- 音源分離手法を用いた複数単語同時認識
- 画像情報と音声情報を併用した単語認識システムの構築について
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討(テーマ関連,顔・人物・ジェスチャ・行動)
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討(テーマ関連,顔・人物・ジェスチャ・行動)
- 特徴選択と複数のサブトラッカによるMean Shift追跡(一般セッション,クロスモーダル)
- 特徴選択と複数のサブトラッカによるMean Shift追跡(一般セッション,クロスモーダル)
- 特徴選択と複数のサブトラッカによるMean Shift追跡(一般セッション,クロスモーダル)
- 特徴選択と複数のサブトラッカによるMean Shift追跡(一般セッション,クロスモーダル)
- 単眼カメラを用いた中央走行型の屋内移動ロボット
- AS-2-3 単眼カメラを用いた屋内移動ロボット(AS-2.スマートパーソナルエレクトロニクスシステムの技術と今後の展開,シンポジウムセッション)
- トラジェクトリ特徴量に基づく単語認識のリアルタイム処理(一般セッション2,アンビエント環境知能)
- トラジェクトリ特徴量に基づく単語認識のリアルタイム処理(一般セッション2,アンビエント環境知能)
- トラジェクトリ特徴量に基づく単語認識のリアルタイム処理(一般セッション2)
- 横顔画像の輪郭形状に基づく読唇(テーマセッション,手,顔,身体表現の認識,理解)
- 複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション,手,顔,身体表現の認識,理解)
- 横顔画像の輪郭形状に基づく読唇(テーマセッション,手,顔,身体表現の認識,理解)
- 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識(一般セッション,福祉と見守りのための画像・音声処理)
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識(一般セッション,福祉と見守りのための画像・音声処理)
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識(一般セッション,福祉と見守りのための画像・音声処理)
- トラジェクトリ特徴量に基づく単語読唇(画像認識,コンピュータビジョン)
- 熱処理による負磁わいアモルファスリボンの応力磁化特性
- A-4-20 顔面熱画像を利用した個人認証(A-4.信号処理,一般講演)
- ハードウェア化された動的輪郭モデルを用いた自律追従システムの開発
- RC-009 多機能コンセントのスケジューリング機能による待機電力の削減(ハードウェア・アーキテクチャ,査読付き論文)
- C-025 ネットワークから制御可能な多機能コンセント(ハードウェア・アーキテクチャ,一般論文)
- 周波数・位相推定手法に基づく複数音声の到来方向推定について
- パラメータ推定手法に基づく複数音源の方向推定について
- パラメータ推定手法に基づく複数音源の方向推定について
- パラメータ推定手法に基づく複数音源の方向推定について
- 動画像処理を目指した動的輪郭モデルのハードウェア化について
- オプティカルフロー分布を利用したMean Shift追跡(画像認識,コンピュータビジョン)
- リアルタイム口部形状認識を利用した意思伝達システム(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- リアルタイム口部形状認識を利用した意思伝達システム(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- リアルタイム口部形状認識を利用した意思伝達システム(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 口内領域形状に基づく日本語単音の分類(一般セッション8(顔・医用画像),文字・文書の認識・理解)
- 口部パターン形状を利用した文字入力システム(一般セッション1)
- 口部パターン形状を利用した文字入力システム(一般セッション1,CV/PR技術のVRへの応用)
- 方向性けい素鋼鈑の曲げ応力による磁化特性
- Co基アモルファスワイヤの特異な応力磁化特性 (ソフト材料)
- 方向性けい素鋼板の応力印加による磁区構造変化 (ソフト材料)
- 負磁歪アモルファスワイヤーの熱処理による応力磁化特性変化
- 線形回路の言語的表現とその記号解析への応用
- A-4-56 高速かつロバストなMean Shift追跡(A-4.信号処理,一般講演)
- オプティカルフロー分布を利用したMean shift追跡--色モデルとフローモデルを統合したMean Shift追跡法の提案
- 回転可動カメラによるリアルタイム人物位置推定システム
- オプティカルフロー分布を利用したMean Shift法による追跡(一般セッション(2), ユビキタスメディアの将来展望)
- オプティカルフロー分布を利用したMean Shift法による追跡(一般セッション(2), ユビキタスメディアの将来展望)
- 照射型赤外線カメラによる人物追尾 (第22回センシングフォーラム 資料--センシング技術の新たな展開と融合) -- (セッション1A1 安全技術--計測部門企画OS)
- A-4-40 音声操作型電動車椅子の開発(A-4.信号処理,一般講演)
- 対向タ-ゲット式スパッタ法によるZnO:Al薄膜の基板温度依存性
- 対向ターゲット式スパッタ法によるガスセンサ薄膜の作成
- テレビ会議のための発言者自動検出(テーマセッション(1),人の検出・計測・認識)
- テレビ会議のための発言者自動検出(テーマセッション(1),人の検出・計測・認識)
- 顔面熱画像を用いた顔認識 (第25回センシングフォーラム資料--センシング技術の新たな展開と融合) -- (パターン計測(1))
- I_040 ビデオ画像と熱画像を用いた単語認識(I分野:画像認識・メディア理解)
- ビデオ画像と熱画像による読唇(一般セッション(2), ユビキタスメディアの将来展望)
- ビデオ画像と熱画像による読唇(一般セッション(2), ユビキタスメディアの将来展望)
- A-4-13 屋内移動ロボットのための走行領域の検出(A-4.信号処理,一般講演)
- 特徴選択と複数のサブトラッカによる Mean Shift 追跡
- 横顔画像の輪郭形状に基づく読唇(テーマセッション4)
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討
- 発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇
- レーザレンジファインダを用いたSLAMによる電動車いすの走行制御(コミュニケーションの心理及び一般)
- A-4-7 リアルタイム口部パターン認識(A-4.信号処理,一般講演)
- 電流センサに基づく家電機器の認識 (第25回センシングフォーラム資料--センシング技術の新たな展開と融合) -- (センサ(2))
- A-4-6 読唇における発話単語からの音節の自動抽出と母音分類(A-4.信号処理,一般講演)
- H-016 唇および口内領域形状に基づくトラジェクトリ特徴量による読唇(H分野:画像認識・メディア理解)