混成主成分分析を用いた音声認識(ポスターセッション)
スポンサーリンク
概要
- 論文の詳細を見る
音声認識のための出力分布表現に対する混合主成分分析(MPPCA: Mixture of Probabilistic Principal Component Analysis)の適用について述べる.MPPCAによれば,混合分布において,少数の有効パラメータのみを,持つ制約付き共分散行列で全共分散行列を近似することができる.またこの有効パラメータの数によってモデルの複雑度を適正に制御することができる.まず,MPPCAの基本的な構成を紹介し,つづいて簡単な拡張によりモデルの複雑度が容易に決定可能となることを示す.さらに,音声認識システムにMPPCAを実装した際発生する数値計算上の問題とその対処についても言及する.実験として共有状態数5,000,総ガウス分布数80,000のQuinphone HMMにおいてMPPCAを適用したモデルを日本語自然発話音声を用い評価した結果,対角共分散モデルでの誤り率22.2%が19.7%に削減され,全共分散モデルと同等の性能が得られたことを示す.あわせて全共分散モデルを上回る性能を得るための課題について考察する.
- 一般社団法人情報処理学会の論文
- 2004-12-20
著者
-
中村 篤
Nttコミュニケーション基礎科学研究所
-
中村 篤
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
シュスター マイク
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
中村 篤
Nttコミュニケーション科学基礎研究所
-
堀 貴明
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
堀 貴明
Nttコミュニケーション科学基礎研究所
-
堀 貴明
日本電信電話(株)
関連論文
- 車載電子機器のEMIシミュレーション技術の開発(電磁環境・EMC,通信の未来を担う学生論文)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 「共感覚者の驚くべき日常」, リチャードE. シトーウィック著, 山下篤子訳, 草思社, 2002年(私のすすめるこの一冊)
- 8-2 日本企業から米国・欧州大学への派遣体験 : 米国マサチューセッツ工科大学編/スイス連邦チューリッヒ工科大学編(8.企業からの客員研究員の海外派遣,私の国際交流の経験)
- パッケージ-チップ間寄生結合を考慮したLSI電源系の高周波特性抽出に関する検討(若手研究者発表会)
- アンサンブル型最小分類誤り学習法の実装と実験的評価(一般セッション,CV・パターン認識のための学習・最適化)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2,コンピュータビジョンとパターン認識のための学習理論)
- アンサンブル型最小分類誤り学習の提案(テーマ関連セッション2)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)