複数口唇領域を利用した多言語に有効な単語読唇(テーマセッション,手,顔,身体表現の認識,理解)

スポンサーリンク

概要

論文の詳細を見る
これまで読唇に関する研究では,特定の言語を対象とする報告がほとんどであり,言語と読唇手法に関する言及はない.さらに従来手法の多くは唇の外側輪郭領域あるいは口内領域を用いており,歯や舌の情報が特徴量に反映されていない.本論文では,多言語に対して有効な読唇手法について言及する.まず,Active Appeamnce Modelを適用し,唇の外側と内側の輪郭を同時に抽出する.次に歯領域と口内領域を抽出する.従来提案されている様々な特徴量を計測して比較実験を行う.本論文では4ヵ国語を対象とし,各言語において20単語の発話シーンを撮影して認識実験を行った.その結果,内側唇輪郭の面積とアスペクト比と口内領域の面積の3形状に基づくトラジェクトリ特徴量が,従来手法やその他の領域を用いた場合よりも高い認識率93.6%を得ることを確認した.
2008-08-29

著者

関連論文

もっと見る

スポンサーリンク