韻律及び話者交代情報を用いたシステム要求検出(システム,第9回音声言語シンポジウム)

概要

論文の詳細を見る
近年,ロボットとのコミュニケーションや,カーナビのように手を使うことが困難な機器への音声インタフェースの適用が顕著である.しかし,現在主に使用されている音声認識システムは入力された音声がシステムへの発話か周囲との雑談かを判別できないため,スイッチ等を用いなければ意図しない誤動作を湧き出させてしまう.一方,人の発話は自然に話している場合でも,話し相手の反応によって韻律的特徴に差が生じる,本研究ではこの韻律的特徴の差と,発話前後での話者の交替からシステムへの問いかけと雑談を判別する.検出された発話区間の前後を考慮して韻律的特徴を求め,Support Vector Machinesによりシステムへの問いかけと雑談の判別を行った結果,F値81.7%の精度で判別することが可能となった.また,システムと複数の話者が同時に存在するような環境では,発話前後での話者の交代を考慮することで,F値で85.1%まで判別精度が向上した.同時に,対数メルフィルタバンクとGabor Wavelet変換を用いた話し方の明瞭度を表す特徴量を検討し,韻律の変化や音素の変化を捉えることにより,F値92.6%の精度でシステムへの問いかけと雑談を判別することができた.
2007-12-13