SP2000-32 話者適応型単語音声認識システムの雑音耐性
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, LVQ-HMMに基づいて構築した話者適応型単語音声認識システムの音声特徴の変動に対する認識性能, 特に雑音耐性について理論的並びに実験的検討を行った。本研究で開発した認識システムは, サブワードを基本認識単位として, LVQとHMMを併用した単語音声認識システムである。このシステムでは, 中間出力情報(入力ベクトルの類別に関する確率分布情報:LVQ出力情報)を入力側にフィードバックさせることで, 環境雑音に対する雑音耐性及び発話者の個人性や発声方法の違いによる音声特徴の変動に対する認識性能の向上を図っている。その結果, 比較的定常な雑音を重畳した音声及び不特定話者音声に対し適応化の効果が見出され, これにより本音声認識システムの雑音耐性及び不特定話者音声に対する認識精度を改善できることが確認された。
- 社団法人電子情報通信学会の論文
- 2000-07-21
著者
関連論文
- 2Z-5 二次元オブジェクトの自発的変形モデルの提案(自然現象,学生セッション,インタフェース)
- G-006 二次元オブジェクトの変形の一方法(生体情報科学,一般論文)
- オフライン電子マネーシステムのメカニズムの提案
- オブジェクト動的再構成機構
- D-14-23 骨導音声を用いた歌声評価・発声訓練システム(II)(D-14.音声・聴覚,一般講演)
- D-14-19 ディジタル補聴器回路の一構成法(D-14.音声・聴覚,一般講演)
- D-14-2 骨導音声を用いた話者識別の検討(D-14.音声・聴覚,一般講演)
- A-19-15 骨導音声を併用した高品質補聴器の一構成(A-19. 福祉情報工学, 基礎・境界)
- A-19-14 骨導音声を用いた歌声評価・発声訓練システム(A-19. 福祉情報工学, 基礎・境界)
- 骨導音声を用いた話者識別と裏声判別(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 骨導音声を用いた話者識別と裏声判別(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- G-015 骨導音声による歌声の評価(G.音声・音楽)
- リカレントニューラルネットワークによる音韻認識
- SP2000-32 話者適応型単語音声認識システムの雑音耐性
- サブワード単位離散単語認識システムの話者依存性の改善
- 聴覚モデルを用いたサブワードに基づく音声認識
- Analysis by Synthesis法による声帯結節の特徴推定
- MLVQを用いた話者適応方式
- 出力情報のフィードバックを有するLVQ-HMM音韻認識システム
- 蝸牛殻の非線形フィードバックモデル
- 嗄声音源波形推定法の評価
- G-005 骨導音声を用いた話者識別(G.音声・音楽)
- D-14-19 サブワード単位離散単語認識システムの雑音耐性