状態分割と分布の畳み込みを用いる残響音声のためのモデル適応
スポンサーリンク
概要
- 論文の詳細を見る
本稿は、残響音声に頑健な音声認識を実現するためのモデル適応法について報告する。あるクリーンなHMMの状態をいくつかのサブ状態に分割して、先行する状態出力系列がよりよく推定できるような新しいHMMに変換する。そして、推定した先行する状態系列を残響特徴量のパラメータに畳み込んで残響音響モデルを合成する。本手法の評価として残響下音声の特定話者孤立単語音声認識実験を行ない効果を確認した。残響時間が120msの残響環境では単語認識率は、クリーンHMMでは30.1%、CMSでは39.8%であったのに対して、提案手法では52.1%に上昇した。
- 社団法人電子情報通信学会の論文
- 2005-01-21
著者
-
西本 卓也
東京大学情報理工学系研究科システム情報学専攻
-
西本 卓也
東京大学大学院情報理工学系研究科
-
嵯峨山 茂樹
東京大学大学院情報理工学系研究科
-
ラウト チャンドラ
東大・情報理工
-
ラウト チャンドラ
東京大学大学院情報理工学系研究科
関連論文
- スパース性に基づくブラインド音源分離を用いたステレオ入力音声認識(音声,聴覚)
- 音声認識応用に関する学会試行標準
- 音楽知識に基づく音高・音長の組合せ特徴量を用いたMIDIデータからの作曲家判別(音楽解析)
- 文字構造の文法記述に基づくオンライン手書き漢字列認識(テーマセッション4,文字・文書の認識・理解)
- 日本語歌詞からの自動作曲(音楽とOR)
- テンポ曲線と隠れマルコフモデルを用いた多声音楽MIDI演奏のリズムとテンポの同時推定(演奏認識/合成,便利で身近な音楽情報処理)
- ラジオ放送番組におけるスポーツ実況中継の分析(視覚障害/聴覚障害,一般)
- ラジオ放送番組におけるスポーツ実況中継の分析
- 調波音・打楽器音分離手法を用いた音楽音響信号からの自動和音認識(音響分析一般(2))
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)