横顔画像の輪郭形状に基づく読唇(テーマセッション,手,顔,身体表現の認識,理解)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,正面顔画像の次に代表的な角度である横顔画像に注目し,横顔画像を利用した読唇手法を提案する.提案手法では,顔輪郭を抽出するために正規化コストに基づく輪郭抽出法を適用する.抽出された顔輪郭より鼻頭,上唇,唇接合部,下唇,顎の5特徴点を検出し,これより求まる8個の特徴量を定義する.日本語の5母音と20単語における発話シーンを撮影し,20通りの特徴量の組み合わせを選び認識実験を行った.その結果,上唇の高さ,下唇の高さ,上唇の突起長,下唇の突起長と口唇角度の5特徴量の組み合わせにおいて,母音認識で99%,単語認識で86%の高認識率を得た.
- 社団法人電子情報通信学会の論文
- 2008-08-29
著者
-
齊藤 剛史
九州工業大学大学院情報工学研究院システム創成情報工学研究系
-
小西 亮介
鳥取大学大学院工学研究科情報エレクトロニクス専攻
-
齊藤 剛史
鳥取大学大学院工学研究科
-
小西 亮介
鳥取大学大学院工学研究科
-
小西 亮介
鳥取大学
関連論文
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討 (ヒューマン情報処理)
- トラジェクトリ特徴量を利用した単語読唇に関する基礎検討 (パターン認識・メディア理解)
- 複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション,手,顔,身体表現の認識,理解)
- 複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション4)
- 携帯電話・ネットワークを利用した個人用の防犯・生活支援システム
- エレベータによるフロア間移動が可能な音声操作型電動車いす(肢体障害・介護,HCGシンポジウム)
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識 (福祉情報工学)
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識 (音声)
- 連続DPマッチングを用いた発話シーンからの単語スポッティング認識 (パターン認識・メディア理解)
- 特徴選択と複数のサブトラッカによるMean Shift追跡 (音声)