マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,実環境下での話者識別において,様々な背景雑音への頑健性を期待できるモデルとして,マルチSNR部分帯域モデルを提案する。提案モデルは,各部分帯域ごとに異なるSNR(マルチSNR)の白色雑音重畳音声で学習したモデルで構成される。性能評価のため,クリーン部分帯域モデル,クリーン全帯域モデル,マルチSNR全帯域モデルの3モデルを比較対象として,様々な雑音環境及びSNR下においてテキスト独立型話者識別実験を行った。その結果,提案モデルは,低SNRで複雑な雑音環境において,他のモデルよりも高い頑健性を示した。また,識別性能改善法として短時間ブロック単位での尤度計算を導入し,その有効性を確認した。
- 社団法人日本音響学会の論文
- 2002-12-25
著者
-
尾関 和彦
電気通信大学電気通信学部情報通信工学科
-
尾関 和彦
電気通信大学情報工学専攻
-
吉田 健一
電通大
-
吉田 健一
電気通信大学大学院電気通信学研究科
-
高木 一幸
電気通信大学情報通信工学科
-
高木 一幸
電気通信大学情報工学専攻
-
高木 一幸
電気通信大学
関連論文
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換