擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)

概要

論文の詳細を見る
これまで環境音は雑音として扱われ,音声認識の前処理などにおいて除去すべき対象として研究が行われてきた.しかし近年,環境音を含めた音環境の理解に注目が集まっている.音環境の理解によって,音場ディクテーションなどが可能となる.従来の環境音識別では,音源そのものを全て個々にモデル化する方法が提案されている.しかし,実世界に無数に存在する環境音を全てモデル化することは不可能である.そこで本研究では,擬音語モデルによる環境音識別を検討する.擬音語は文字表記から音源を想起可能である.この特性を利用し,無数に存在する環境音から類似した音源を1つのモデルで表現することで,有限個の擬音語モデルによる環境音識別が可能となる.本研究ではまず予備実験を行い,環境音識別のための最適パラメータが,標本化周波数16kHz,MFCC16次元,8状態,128混合であることを確認し,また環境音と擬音語の対応関係について調査した.そして,音源ごとにモデル化を行う従来法と,擬音語モデルを用いる提案法について環境音識別実験を実施し,従来法と比較して提案法の誤識別率が低下することを確認した.最後に主観評価実験の結果,従来法と比較し提案法は,識別結果から音源を容易に想起可能であることを確認した.
社団法人電子情報通信学会の論文
2010-05-19

擬音語HMMに基づく音場ディクテーションの検討(音声,応用音響,一般,音声,応用/電気音響,信号処理,及び一般)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク