マルチSNR部分帯域モデルを用いた雑音環境下での話者識別

スポンサーリンク

概要

論文の詳細を見る
本稿では,実環境下での話者識別において,様々な背景雑音への頑健性を期待できるモデルとして,マルチSNR部分帯域モデルを提案する。提案モデルは,各部分帯域ごとに異なるSNR(マルチSNR)の白色雑音重畳音声で学習したモデルで構成される。性能評価のため,クリーン部分帯域モデル,クリーン全帯域モデル,マルチSNR全帯域モデルの3モデルを比較対象として,様々な雑音環境及びSNR下においてテキスト独立型話者識別実験を行った。その結果,提案モデルは,低SNRで複雑な雑音環境において,他のモデルよりも高い頑健性を示した。また,識別性能改善法として短時間ブロック単位での尤度計算を導入し,その有効性を確認した。
社団法人日本音響学会の論文
2002-12-25

著者

関連論文

もっと見る

スポンサーリンク