音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価(雑音・VAD,第9回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響モデルと言語モデルに基づく認識による音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価を行う.従来のVAD手法として振幅パワー,統計モデル,GMMなどに基づく手法を挙げ,性能比較実験を行うことで提案手法の有効性を示す.
- 社団法人電子情報通信学会の論文
- 2007-12-13
著者
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
猿渡 洋
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
李 晃伸
名古屋工業大学大学院工学研究科創生シミュレーション工学専攻
-
川波 弘道
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
猿渡 洋
奈良先端科学技術大学院大学
-
李 晃伸
名古屋工業大学
-
川波 弘道
奈良先端科学技術大学院大学
-
李晃伸
名古屋工業大学大学院情報工学専攻
-
鹿野 清宏
奈良先端科学技術大学院大学
-
酒井 啓行
奈良先端大・情報
-
酒井 啓行
奈良先端科学技術大学院大学情報科学研究科
-
ツィンツァレク トビアス
奈良先端科学技術大学院大学情報科学研究科
-
季 晃伸
京大
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- ICAによる雑音推定を用いた平均二乗誤差最小化短時間振幅スペクトル推定法に基づく両耳補聴器 (応用音響)