マルチSNR部分帯域GMMを用いた雑音環境下での話者認識

スポンサーリンク

概要

論文の詳細を見る
音声をスペクトル領域でいくつかの部分帯域に分割したとき, 各部分帯域の話者認識に対する貢献度は, その中に含まれる個人性情報や音韻情報の量によって異なる.このように部分帯域によって異なる情報を利用するためには, 各部分帯域毎に話者モデル作成や尤度計算を行う部分帯域モデルが有効である.しかし, 実環境では通常, 音声に様々な雑音が混入するため, 雑音を考慮した部分帯域モデルを作成する必要がある.本稿では, 各部分帯域に対して, 種々のSNRを持つ雑音付加音声で学習した複数のGMMを用意することにより, 雑音に対する頑健性を高めた部分帯域モデル(マルチSNR部分帯域モデル)を提案する.いくつかの雑音環境下でのテキスト独立型話者識別実験により, このモデルは従来の部分帯域モデルや全帯域モデルよりも高い識別性能を持つことが明らかになった.また, 尤度再結合重みの最適化を行うことにより, 識別性能が改善されることが確認された.
社団法人電子情報通信学会の論文
2000-09-22

著者

関連論文

もっと見る

スポンサーリンク