話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
スポンサーリンク
概要
- 論文の詳細を見る
近年,周囲の者に知覚されにくい音声認識を実現するための技術として,非可聴つぶやき(Non-Audible Murmur:NAM)認識が注目されている.これまで,NAM発声に熟知した話者に対してNAM用特定話者音響モデルを作成することで,高い認識性能が得られている.一方で,一般的な話者,すなわちNAM発声に不慣れな話者の認識性能は,話者毎に大きくばらつくことが分かっている.本稿では,不慣れな話者の認識性能を向上させ,話者毎の認識性能のばらつきを抑えるために,各話者への適応時に,話者正規化学習(Speaker Adaptive Training:SAT)を用いた正準モデルを使用する.実験的評価により,SATを使用することで認識率が大きく改善されることを示す.
- 社団法人情報処理学会の論文
- 2008-10-17
著者
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
猿渡 洋
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
戸田 智基
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
中村 圭吾
奈良先端科学技術大学院大学情報科学研究科
-
長井 孝之
奈良先端科学技術大学院大学情報科学研究科
-
猿渡 洋
奈良先端科学技術大学院大学
-
戸田 智基
奈良先端科学技術大学院大学
-
鹿野 清宏
奈良先端科学技術大学院大学
-
中村 圭吾
奈良先端科学技術大学院大学 情報科学研究科
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- ICAによる雑音推定を用いた平均二乗誤差最小化短時間振幅スペクトル推定法に基づく両耳補聴器 (応用音響)