顔領域の違いが読話性能に与える影響について(一般セッション,時系列パターン認識)

スポンサーリンク

概要

論文の詳細を見る
読話とはロの動きや形状を読み取り発話内容を理解する技術のことを指す.従来の読話の研究の多くは口唇領域に対して行われてきた.しかし,発話する音によっては口の動作が大きく周辺の皺や顎の形状の変化が大きい音や,口の動作が小さい音など,様々である.そこで本論文では(A)顔全体領域,(B)顔全体領域から目と鼻を除いた領域,(C)口唇領域と顎から鼻孔までの高さを含んだ領域,(D)口唇領域の4つの領域を用いて単語認識,母音・子音認識を行った.実験の結果,ほとんどの母音について領域(B)が最も高い性能を示し,一方で子音については音素ごとに認識性能が高い領域が異なることが分かった.
2012-02-02

著者

関連論文

もっと見る

スポンサーリンク