音声の動的特徴とFeature Mapを用いた話者識別

スポンサーリンク

概要

論文の詳細を見る
音声の動的特徴とfeature mapを用いるテキスト独立型の話者識別について述べる。各話者のモデルは、コホーネンのfeature mapと予測ネットからなっている。第1の部分は話者の音声の特徴ベクトルからfeature mapに写像し、入力音声をmap上の特定のベクトルに量子化する。第2の部分は、featuremap上の出力の時間変化パターンを予測するものであり、逆伝播アルゴリズムにより学習する。識別は、VQ歪みと予測誤差の組み合わせにより行う。8名の話者に対する識別実験実験結果より、メルケプストラムのfeature mapと2次元メルケプストラムの予測ネットの組み合わせが高いスコアを与え、時間変化にも強いことが示された。
社団法人電子情報通信学会の論文
1995-09-11

著者

関連論文

もっと見る

スポンサーリンク