不特定話者混合分布HMMにおけるTree-Basedクラスタリングの検討
スポンサーリンク
概要
- 論文の詳細を見る
Tree-basedクラスタリングは,音素コンテキストを分割条件としてトライフォンの集合に対してクラスタリングを行いHMM状態の共有化を図る有効な手法である.従来の報告では,計算量の点から対象が単一分布HMMに限られていた.しかし,単一分布HMMでは不特定話者の音響的特徴を表現するのに不十分であるため,必ずしも適切なトポロジ(HMM状態の共有関係)が得られていないと考えられる.また所望の混合分布トライフォンを得るためには,tree-basedクラスタリングの後,混合数を倍増する操作と学習を繰り返すため膨大な時間を要する.そこで,本稿では混合分布トライフォンに対して分布のクラスタリングを行いながらtree-basedクラスタリングを行う手法を提案する.本手法により学習時間が1/3程度に短縮され,認識実験では1〜2%の音素正解精度の改善を確認した.
- 社団法人電子情報通信学会の論文
- 1999-12-20
著者
-
加藤 恒夫
株式会社KDDI研究所
-
樋口 宜男
KDD研究所
-
加藤 恒夫
KDDI研究所
-
清水 徹
情報通信研究機構:atr音声言語コミュニケーション研究所
-
樋口 宣男
Kdd研究所
-
黒岩 真吾
国際電電 研
-
黒岩 眞吾
徳島大学大学院ソシオテクノサイエンス研究部:独立行政法人情報通信研究機構知識創成コミュニケーション研究センター音声言語グループ
-
黒岩 眞吾
国際電信電話株式会社 上福岡研究所
-
清水 徹
知識創成コミュニケーション研究セ
関連論文
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式 (ディペンダブルコンピューティング)
- 多数の携帯電話とデジタルサイネージ間のインタラクションを可能にするクライアントサーバー型Bluetooth通信方式 (コンピュータシステム)
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 音声翻訳研究20年の夜明け : 受賞業績 携帯電話によるネットワーク型コーパスベース音声翻訳システムの構築(平成19年度喜安記念業績賞紹介)
- 2D-5 多言語音声翻訳基盤の通信インタフェースの検討と構築(音声対話・翻訳,一般セッション,人工知能と認知科学)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- B-7-90 VoIPサービス向け通話品質評価手法
- 雑音の特徴分析に向けた実環境雑音データベースの構築
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)