音響パプメータと調音パラメータの結合を考慮した音声認識(聴覚・音声・言語とその障害)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、われわれは調音パラメータにある静的と動的な成分による音声認識への貢献を考察し、調音パラメータを音響パラメータに結合したいくつかの音声認識方法を検討した。調音運動を磁気センサー装置により観測し音声信号も同時に記録した。本研究では、まず特定の観測点からなる調音パラメータを用いるいくつかの認識実験により、調音器官の異なる部位による貢献度を考察した。次は、調音運動の変位成分を直接音響パラメータと結合を行った。その結果、調音パラメータは音響パラメータにない音声認識に有用な情報を持っていることがわかった。さらに、調音運動の動的な成分の音声認識への貢献度は調音運動の変位成分と同様な手法で評価した。調音データの加速度成分は音響パラメータの相当する成分(△△MFCC)に比べて音声認識に大きく貢献している。最後に、調音パラメータと音響パラメータとの結合方法について検討した。基本的なアプローチはHMMの状態ごとにベイジァンネットワークを付き加えて、調音パラメータはモデル学習段階で観測できる量とされるが、音声認識段階において隠れ変数として取り扱われる。その結果、HMM/BNによる音声認識率は通常のHMMモデルより高くなっている。
- 社団法人電子情報通信学会の論文
- 2004-03-22
著者
関連論文
- 高効率エネルギー放射を意図したアンプの研究開発(学生研究発表会)
- D-14-1 素片編集型音声合成における発話スタイルに関する研究(D-14. 音声,一般セッション)
- IECを用いた素片接続コストの重み係数推定
- GMMに基づいた雑音感度関数を用いたロバスト音声認識(聴覚・音声及び一般)
- 母音学習過程における音声知覚と調音変化の関係について
- 3次元MRI動画データと実音声を用いた声道断面積モデルのパラメータ推定
- 3次元舌モデルを用いる母音構音のforce vector及びλvectorに関する検討(音声・聴覚,一般)
- 喉頭モデルでカップリング問題関する数値解析(音声・聴覚,一般)
- 発話機構モデルに基づく音声と調音状態との一対多の関係に関する考察
- 音声と一対多の関係にある調音状態の分布構造 : 発話機構モデルに基づく考察(聴覚・音声・言語とその障害,一般)
- D-14-17 破裂子音の音響特徴に関する研究(D-14. 音声,一般セッション)
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- リアルな発話運動を実現する生理学的口唇力学モデルの構築(バイオサイバネティックス, ニューロコンピューティング)
- 模倣による調音ダイナミクスモデル制御の獲得(「脳・認知科学」及び一般)
- 音声生成における軟口蓋の働きのモデル化に関する研究(音声・聴覚,一般)
- 調音運動ダイナミクスの音声認識への応用(聴覚・音声/一般)
- 調音データに基づいた調音結合の分析
- 発話時舌内部変形のモデルシミュレーションとtagged-MRIによる観測との比較(合成, 生成, 韻律, 一般)
- 音声と一対多の関係にある調音状態の分布構造--発話機構モデルに基づく考察
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割(聴覚・音声/一般)
- 通常発話状態と特異発話状態との判別基準の検討(聴覚・音声/一般)
- 乳幼児の音声模倣能力の獲得過程における調音ジェスチャの役割
- 通常発話状態と特異発話状態との判別基準の検討
- 日本語5母音の調音・音響的観測とモデルシミュレーションとの比較(音声・聴覚,一般)
- 生理学的発話機構モデルを用いた音響特性と発話状態の関連性の検討
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(福祉と音声処理及び一般)
- 生理学的な調音モデルを用いた調音結合のモデル化及びシミュレーション
- 音響パプメータと調音パラメータの結合を考慮した音声認識(聴覚・音声・言語とその障害)
- 加重等分解度特徴量を用いたテキスト独立型話者識別
- 発話運動における調音結合の分析について
- 加重等分解度特徴量を用いた話者識別
- 生理学的特徴量の話者識別における有効性についての検討
- 復唱による母音学習過程における音声知覚に関する考察
- ディジタルオーディオにおける深い感性に関連した音質劣化の原因究明--jitterに起因する音質劣化の仕組みの解明と新改善方法の検討 (特集 感性ロボティクス)
- MR画像に基づいた変形による生理学的発話機構モデルの個人化(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)