音声認識のための高速環境適応
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes a rapid environment adaptation algorithm based on spectrum equalization (REALISE). In practical speech recognition applications, differences between training and testing environments often seriously diminish recognition accuracy. These environmental difference can be classified into two types: difference in additive nosie and differences in multiplicative noise in the spectral domain. The proposed method calculates time-alignment between a testing utterance and the closest reference pattern to it, and then calculates the noise differences between the two according to the time-alignment. Then, we adapt all reference patterns to the testing environment using the differences. Finally, the testing utterance is recognized using the adapted reference patterns. In a 250 Japanese word recognition task, in which the training and testing microphones were of two different types, REALISE improved recognition accuracy from 87% to 96%.
- 社団法人日本音響学会の論文
著者
-
渡辺 隆夫
日本電気(株)中央研究所
-
服部 浩明
Nec メディア情報研究所
-
高木 啓三郎
Nec 情報メディア研究所
-
高木 啓三郎
Information Technology Research Laboratories,NEC Corporation
-
服部 浩明
Information Technology Research Laboratories,NEC Corporation
-
渡辺 隆夫
Information Technology Research Laboratories,NEC Corporation
関連論文
- C&Cの夢,自動通訳の実現に向けて : 受賞業績 携帯端末など組込み機器向け多言語自動音声翻訳システムの実用化技術の開発(平成20年度喜安記念業績賞紹介)
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 音声による文章入力のための言語モデル適用法の検討
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- ビームサーチを用いた大語彙音声認識方式の検討
- LE-1 自由文通訳と例文選択型通訳を統合した自動通訳システム(E. 自然言語・文書)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 自動通訳システムINTERTALKERにおける日本語音声合成
- AS-1-3 低消費電力マルチコアプロセッサで動作する大語彙連続音声認識とその応用(AS-1.マルチコアプロセッサ技術,シンポジウム)
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 概念表現を用いた自動通訳システムINTERTALKER
- 音声認識のためのスペクトルの調波構造の利用
- SNRの変動を考慮したスペクトルサブトラクションの検討
- 種々の電話機による音声認識性能の評価
- 環境変動を考慮した電話音声認識方式の種々の電話機による評価
- 雑音環境を考慮した自律型話者適応化
- 雑音環境の変動を考慮した話者適応化
- 音声認識のための高速環境適応
- 高速環境適応におけるコンパクト化の検討
- 雑音環境の変動に強い音声認識 (音声/オ-ディオ信号処理) -- (音声認識)
- 音声認識のための高速環境適応
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話者照合における連続音節認識による登録パターン作成方法
- 認識対象語彙の音素環境を考慮した半音節を用いた音声認識
- 音素環境を考慮した半音節を単位とする音声認識方式の検討
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 自動通訳システム (音声ヒューマンインタフェース特集)
- 連続音声認識からの概念表現の作成
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化(論文賞贈呈)
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化
- 情報量基準を用いた音声認識単位の自動生成
- 記述長最小原理を用いた話者適応化
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 木構造化された確率分布を用いた話者適応化
- 大語彙音声入力装置の開発
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 話し言葉認識技術とその応用 (ユビキタス環境を活用し,企業競争力を向上させる「UNIVERGE」特集) -- (ソリューション)
- 半音節を単位とするHMMを用いた不特定話者音声認識
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声認識におけるパタンマッチングの手法
- D-14-5 コンパクトな音声合成用テキスト解析エンジンの開発
- 決定木を利用した代表ピッチパタンの自動獲得
- 音声合成 (音声ヒューマンインタフェース特集)
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作