階層的Eigen Voice法による話者適応化(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識において新話者の少量発声を用いて良好な話者適応化が可能な方式として, EigenVoice(EV)法が知られている.しかしEV法では,適応化するパラメータ数が事前に固定されており,適応化用の発声が増えた場合にそれに応じた認識性能の改善が難しいという課題がある.そこで本論文では,EV法にモデル複雑度制御を導入した階層的EigenVoice (Hierarchical Eigen Voice, HEV)法を提案する.提案法では,適応化用発声の量に応じて適切な複雑度を自動的に選択できるため,少量発声で有効なだけでなく,発声量が増えるに応じて更に認識性能を改善できることが期待される.またEV法をトライフォンなどの環境依存音素HMMに適用するためには,巨大な共分散行列の固有ベクトルを求める必要があったが,提案法では共分散行列を小さく抑えることができるので実装が極めて容易になるという利点がある.更にEV法やHEV法の少量発声における適応性能を改善するために,事前確率分布を用いたMAPED (Maximum A Posterior Eigen Decomposition)推定法も提案する.日本語大語彙適続音声認識タスクを用いて,他の話者適応化方式(MLLR法,自律的モデル複雑度制御法など)と比較評価実験を行った.提案方式は新話者の5文発声で,他方式の50文発声と同程度の認識性能を得た.また適応化用発声の量が増えると,それに応じて認識性能が改善され,提案方式の有効性が確認された.
- 社団法人電子情報通信学会の論文
- 2003-10-01
著者
関連論文
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 大語彙姓離散発声電話音声認識の検討
- コンパクトなディクテーションの開発
- D-14-6 コンパクト日本語ディクテーションの開発
- F-9 大語彙音声認識を用いたPDA向け音声UIの試作(音声・音声言語情報処理,F.音声・音楽)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 木構造辞書とネットワーク文法を用いたコンパクト大語彙連続音声認識エンジン
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 裁判員裁判向け音声認識システム (音声認識ソリューション・製品特集) -- (ソリューション・サービス)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 十分統計量を用いた教師なし話者適応における話者選択法(一般(ポスターセッション),第9回音声言語シンポジウム)
- 17pWF-4 準1次元系における磁場中スピン三重項超伝導機構
- 25pSC-6 準1次元系での動径方向にノードを持つギャップレス超伝導
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- 音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 音声認識・合成ソフトウェアを利用した音声I/Fを持つ電子メールシステムの試作
- 音声認識/合成ソフトウェアのAPI開発
- 階層的Eigen Voice法による話者適応化(音声,聴覚)
- 階層的主成分分析を用いた木構造話者適応
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- パソコン向け音声認識ソフトウェア
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- MDL基準を用いたHMMサイズの削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 音素記号と特徴ベクトルの同時出力確率を用いた音声認識
- 音声インターフェースを用いたWeb新聞へのアクセス
- 音声インターフェースを用いたWeb新聞へのアクセス
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作
- ニュ-ラル予測モデルを用いた不特定話者音声認識 (ニュ-ロコンピュ-ティング論文)
- 音声認識におけるモデル間スケーリング係数の自動推定(音声,聴覚)
- 音声認識におけるモデル間スケーリング係数の自動推定