擬似的学習データを用いた単語スポッタ用ガーベジモデル学習法
スポンサーリンク
概要
- 論文の詳細を見る
単語スポッテイングのためのガーベジモデルの高精度化に関しては, 誤り最小化基準に基づく学習法の有効性が報告されている. しかしながら, これらの方法は, 大量の音声サンプルを用いるため, キーワードセットの変更ごとに音声サンプルの収集, 切出し加工等, 必然的に長い期間を要する工程が必要であり, 迅速なキーワードセット変更は原理的に不可能であった. 今後, 単語スポッテイングを用いたシステムを広く実用に供するにあたって, 使用状況に応じたキーワードセットの変更が必要になると考えられる. 本論文では, 収集, 加工のために長い工程を要する音声サンプルの代わりに, 環境依存音響モデルをもとに擬似的に生成した学習データを用いることで, 迅速なキーワードセット変更を可能とするガーベジモデル学習法を提案する. 4状態, left-to-right型ガーベジモデルに対する本学習法の適用と単語スポッテイング実験によって, キーワードセット変更に対して迅速かつ的確に性能改善効果が得られることを示した.
- 社団法人電子情報通信学会の論文
- 1999-04-25
著者
関連論文
- 生成駆動音声認識方式 (GD-SR)
- 単語グラフから例文集へのマッピング
- 生成駆動音声認識方式(GD-SR)
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- クライアント・サーバ型 ATR-MATRIX
- 一般化ラプラス混合分布に基づく音声認識用音響デモリング(音声情報処理 : 現状と将来技術論文特集)
- クライアント・サーバ型ATR-MATRIX
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 擬似的学習データを用いた単語スポッタ用ガーベジモデル学習法
- 隠れマルコフモデルを用いた音声認識
- 一般的ラプラス分布に基づく音響モデル
- 不特定話者音響モデルにおけるガウス混合分布再構成法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- ガウス混合分布の再構成による不特定話者音響モデルの改善
- 擬似的学習データを用いた単語スポッティング用ガーベジモデル学習法
- 擬似的学習データを用いたキーワードスポッタのためのガーベジモデル学習法