聴覚モデルを用いたサブワードに基づく音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 聴覚モデルを用いたサブワード単位に基づく音声認識について取り扱う. 連続音声を音響学的特徴の安定した部分(サプワード)に分解し, これを新たな認識単位として認識を行う新しい音声認識方式が提案されている. この音声認識法は, 極めて高精度の音声認識システムの実現が可能となる反面, 雑音耐性に劣っている. そのため雑音環境下での実用化を考えると問題がある. そこで, フロントエンドに雑音耐性に優れている聴覚モデルを用いたサブワード単位に基づく音声認識システムの開発を行った. 雑音を加えない単語音声及び雑音が重畳された単語音声に対して行われた認識実験の結果に基づいて, フロントエンドにDFTを用いた場合及び雑音効果低減策としてスペクトルサブトラクション法を用いた場合との比較・検討を行い, 本認識システムの有用性を明らかにする.
- 社団法人日本音響学会の論文
- 1997-12-25
著者
関連論文
- 2Z-5 二次元オブジェクトの自発的変形モデルの提案(自然現象,学生セッション,インタフェース)
- G-006 二次元オブジェクトの変形の一方法(生体情報科学,一般論文)
- オフライン電子マネーシステムのメカニズムの提案
- オブジェクト動的再構成機構
- D-14-23 骨導音声を用いた歌声評価・発声訓練システム(II)(D-14.音声・聴覚,一般講演)
- D-14-19 ディジタル補聴器回路の一構成法(D-14.音声・聴覚,一般講演)
- D-14-2 骨導音声を用いた話者識別の検討(D-14.音声・聴覚,一般講演)
- A-19-15 骨導音声を併用した高品質補聴器の一構成(A-19. 福祉情報工学, 基礎・境界)
- A-19-14 骨導音声を用いた歌声評価・発声訓練システム(A-19. 福祉情報工学, 基礎・境界)
- 骨導音声を用いた話者識別と裏声判別(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- 骨導音声を用いた話者識別と裏声判別(顔・ジェスチャ認識のためのパターン認識メディア理解,一般)
- G-015 骨導音声による歌声の評価(G.音声・音楽)
- リカレントニューラルネットワークによる音韻認識
- 任意不規則変動音のL_<eq>評価量に及ぼすサンプル間隔の統計的影響(理論と実験)
- 声でのどの病気を探る
- SP2000-32 話者適応型単語音声認識システムの雑音耐性
- サブワード単位離散単語認識システムの話者依存性の改善
- 聴覚モデルを用いたサブワードに基づく音声認識
- Analysis by Synthesis法による声帯結節の特徴推定
- MLVQを用いた話者適応方式
- 出力情報のフィードバックを有するLVQ-HMM音韻認識システム
- 蝸牛殻の非線形フィードバックモデル
- 嗄声音源波形推定法の評価
- PPM方式による水中データ伝送
- 不規則形状面による音波の散乱
- G-005 骨導音声を用いた話者識別(G.音声・音楽)
- D-14-19 サブワード単位離散単語認識システムの雑音耐性