生成駆動音声認識方式 (GD-SR)
スポンサーリンク
概要
- 論文の詳細を見る
ATR音声翻訳通信研究所では、音声翻訳システムに向けての研究を行なっている。本報告では、音声翻訳の際に問題となる認識誤り (脱落、湧出) を効果的に抑制し、適切に言語翻訳処理可能な結果を出力する音声認識手法を提案する。提案手法 (生成駆動音声認識 "Generaion Driven Speech Recognition (GD-SR)") は1度目の音声認識結果を基に文仮説を生成し、生成した仮説を言語制約として再度音声認識を行なうという手法である。実験を行ない、従来のN-gramモデルに比較して単語正解率が6%向上し、又、認識結果の翻訳の成功率は21%向上する、という結果を得た。
- 社団法人電子情報通信学会の論文
- 1997-10-23
著者
関連論文
- 生成駆動音声認識方式 (GD-SR)
- 単語グラフから例文集へのマッピング
- 生成駆動音声認識方式(GD-SR)
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- クライアント・サーバ型 ATR-MATRIX
- 一般化ラプラス混合分布に基づく音声認識用音響デモリング(音声情報処理 : 現状と将来技術論文特集)
- クライアント・サーバ型ATR-MATRIX
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 擬似的学習データを用いた単語スポッタ用ガーベジモデル学習法
- 隠れマルコフモデルを用いた音声認識
- 一般的ラプラス分布に基づく音響モデル
- 不特定話者音響モデルにおけるガウス混合分布再構成法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- ガウス混合分布の再構成による不特定話者音響モデルの改善
- 擬似的学習データを用いた単語スポッティング用ガーベジモデル学習法
- 擬似的学習データを用いたキーワードスポッタのためのガーベジモデル学習法