一般化ラプラス混合分布に基づく音声認識用音響デモリング(音声情報処理 : 現状と将来技術論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識用の音響モデルにおいては, ガウス分布, あるいはガウス混合分布が広く用いられている.未知の母集団をパラメトリックにモデリングする際にガウス分布を用いることの一般的優位性は, 中心極限定理に代表される.ガウス分布がもつ様々な性質によって理論的には明らかであるが, 一方で, 音声認識のために, 限られた数の学習用データサンプルを用いて音響的特徴量の時系列をモデリングするという具体的な問題に対して, ガウス分布をベースとする方法が常に最適である保証はない.本論文では, ラプラス分布ガウス分布を包含し, より広範な分布形状を表現可能な, 一般化ラプラス分布をベースとする音響モデリングを提案する.一般化ラプラス分布の定式化と分布パラメータ推定法を示すとともに, ガウス混合出力分布をもつ隠れマルコフモデルの再学習によって一般化ラプラス混合出力分布をもつ音響モデルを構築し, 自然発話音声を用いた連続音声認識実験によってガウス混合分布に基づく場合に比して認識性能が向上することを示した.
- 社団法人電子情報通信学会の論文
- 2000-11-25
著者
関連論文
- 生成駆動音声認識方式 (GD-SR)
- 単語グラフから例文集へのマッピング
- 生成駆動音声認識方式(GD-SR)
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- クライアント・サーバ型 ATR-MATRIX
- 一般化ラプラス混合分布に基づく音声認識用音響デモリング(音声情報処理 : 現状と将来技術論文特集)
- クライアント・サーバ型ATR-MATRIX
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 擬似的学習データを用いた単語スポッタ用ガーベジモデル学習法
- 隠れマルコフモデルを用いた音声認識
- 一般的ラプラス分布に基づく音響モデル
- 不特定話者音響モデルにおけるガウス混合分布再構成法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- ガウス混合分布の再構成による不特定話者音響モデルの改善
- 擬似的学習データを用いた単語スポッティング用ガーベジモデル学習法
- 擬似的学習データを用いたキーワードスポッタのためのガーベジモデル学習法