変分ベイズ法に基づく音響モデルのトポロジー学習および混合分布要素の分割(ポスターセッション)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,変分ベイズ法に基づく手法で,非均一な長さの環境依存HMM構造を自動で生成する方法および混合分布要素を分割する方法を提案する.ゆう度最大化規準(ML)がHMM構造作成に一般に用いられるが,過学習問題が存在する.これを避けるため,近年,変分ベイズ法が音声認識の音響モデルに適用されてきている.我々は変分ベイズ法を逐次状態分割法(Successive State Splitting, SSS)法に適用する.この手法は環境方向だけでなく,時間方向のバリエーションを生成できる.実験結果から,提案法は従来法より効率的なモデルを自動で作成できることが分かった.さらに,時間方向の構造も考慮した変分ベイズ法に基づく混合分布数の増加手法についても検討した.変分ベイズ的手法により,従来法と比較して,より少ない混合数でほぼ同様な性能が得られることが分かった.
- 社団法人電子情報通信学会の論文
- 2004-12-13
著者
-
中村 哲
ATR音声言語通信研究所
-
實廣 貴敏
ATR音声言語コミュニケーション研究所
-
中村 哲
Atr音声口語コミュニケーション研究所
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
関連論文
- A-16-18 Blendshapesによるリップシンクアニメーションのためのキーフレーム削除法(A-16.マルチメディア・仮想環境基礎,一般講演)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- バイモーダル音声認識における音素境界を越えた同期性のモデル
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- 連続音声認識候補受理/リジェクションのためのワードスポッティング仮説検証手法(第5回音声言語シンポジウム : システム・信頼度)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)