話者クラスタリング手法を用いた不特定話者音素HMM作成法
スポンサーリンク
概要
- 論文の詳細を見る
HMMの学習のためのBaum-Welchでは, 学習話者数を変更したり新たなデータを追加する場合は, 最初から学習をやり直す必要があった. 大規模な不特定話者HMMを変更する場合, 計算時間の点で大きな問題となっていた. そこで本論文では, 不特定話者のHMMを作成する場合, 話者の情報を考慮に入れたモデリングにより, 以上の問題点を解決する方法を提案する. 具体的には, 特定話者のHMMをクラスタリングして合成することにより, パラメータの再推定なしに不特定話者HMMを作成する方法を提案する. 更に不特定話者音素HMM作成における, 話者の種類と話者数についての検討を行った. 以上について不特定話者音声認識実験により評価した. その結果, 本手法では従来法のBaum-Welchアルゴリズムと比較して, 性能の低下なしにモデル作成時の計算量を約 1/20〜1/60 に削減できることがわかった. 更に, 特定話者HMMが用意されていれば, 話者15人の場合1分程度で不特定話者HMMが作成でき, 簡便にモデルに話者の追加・変更が可能であることがわかった. また話者の種類を検討した結果, 不特定話者HMMを作成する場合, クラスタリングにより話者を選択することが有効であることがわかった.
- 社団法人電子情報通信学会の論文
- 1996-03-25
著者
-
小坂 哲夫
Atr音声翻訳通信研究所:現在 キャノン情報メディア研究所
-
小坂 哲夫
(株)atr自動翻訳電話研究所((株)atr音声翻訳通信研究所)
-
松永 昭一
(株)ATR音声翻訳通信研究所
-
倉岡 幹雄
豊橋技術科学大学
-
松永 昭一
Atr音声翻訳通信研究所:現在 Nttヒューマンインタフェース研究所
関連論文
- 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- MAP-VFS話者適応法における平滑化係数制御の効果
- 発話/話者適応による自由発話音声中の音素認識
- 木構造話者クラスタリングを用いた話者適応
- 最大事後確率推定法と移動ベクトル場平滑化法を統合した話者適応方式
- 話者適応のための木構造話者クラスタリング
- 話者混合逐次状態分割法による不特定話者音声認識と話者適応
- 学習用テキストからの認識探索空間作成能力の評価
- 音節連鎖統計情報のタスク適応化
- Top-Down音韻認識とBottom-Up音韻認識を融合した音声認識
- Top-down音韻認識とBottom-up音韻認識を融合した音声認識 (音声認識)
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- 逐次状態分割法の分割過程木構造を用いた話者適応方式の検討
- 逐次状態分割法の分割過程を考慮した移動ベクトル場平滑化の検討
- 音素クラスタモデルを用いた未登録語の検出法の検討
- 連続音声認識における未知語検出の検討
- 大語い連続音声認識のための単語仮説数削減
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 語順の制約による探索空間の削減効果
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 品詞および可変長単語列の複合N-gramの自動生成
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 状態別話者クラスタリングを用いた不特定話者モデルの検討
- 識別誤り最小基準による連続出力分布型HMMの学習