マルチ発話様式を考慮した肉伝導音声認識用音響モデルに関する予備的検討(特徴量, 区間検出)
スポンサーリンク
概要
- 論文の詳細を見る
空気伝導音声の収録を目的とした従来のマイクロフォンによる音声認識は, 主に通常音声を対象としている.しかし, 音声認識を利用する際に, 周囲の環境に応じて発話様式は変化する.つぶやき声のような音量の小さな発声は, 外部雑音の影響を受けるため従来のマイクロフォンによる採取が難しい.そこで, 肉伝導音声用マイクロフォンを利用した音声認識実験に着目する.肉伝導音声用マイクロフォンは, つぶやき声などの微小な肉伝導音が採取可能な体表密着型のマイクロフォンで, 外部雑音にも頑健である.また, 肉伝導音声用マイクロフォンで通常音声も採取する事ができる.この肉伝導音声用マイクロフォンを利用してデータを収集し, データの分析, MLLR適応による音響モデルの作成, 評価を行った.様々な発声方法に対応するため, 非可聴つぶやき, ささやき声, 小声, 通常音声といった4種類のデータを用意し, 音声認識実験を行う.各々の発話様式のデータから作成された特定発話様式モデルの評価結果から, 声帯振動を伴う音声と伴わない音声で音響特徴量などが大きく異なり, 1つの特定発話様式モデルでは種々の発話様式に対応することが困難であることを示す.また, 全ての発話様式のデータを利用して作成されたマルチ発話様式音響モデルの評価結果から, 様々な発話様式に対応できる音響モデルを構築できる可能性を示す.
- 社団法人電子情報通信学会の論文
- 2005-06-17
著者
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
猿渡 洋
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
戸田 智基
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
猿渡 洋
奈良先端科学技術大学院大学
-
戸田 智基
奈良先端科学技術大学院大学
-
鹿野 清宏
奈良先端科学技術大学院大学
-
イラクレウス パニコス
奈良先端科学技術大学院大学
-
HERACLEOUS Panikos
ATR-SLT
-
貝野 友美
奈良先端科学技術大学院大学情報科学研究科
-
貝野 友美
奈良先端科学技術大学院大学 情報科学研究科
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- ICAによる雑音推定を用いた平均二乗誤差最小化短時間振幅スペクトル推定法に基づく両耳補聴器 (応用音響)