信頼度に基づく移動ベクトル選択を用いたVFS話者適応化手法
スポンサーリンク
概要
- 論文の詳細を見る
移動ベクトル場平滑化話者適応方式(VFS)における移動ベクトルの信頼度を考慮した移動ベクトル場平滑化手法の提案と, 本手法をMAP・VFS話者適応化手法に適用した結果を示す. 最大事後確率推定(MAP推定)に基づき得られる移動ベクトルは, 最ゆう推定に基づき得られる移動ベクトルに分布の実質的な学習データの個数に基づく重みを付したものとなり, この重みは移動ベクトルの信頼度とみなすことができる. VFSでは学習された分布に関する移動ベクトルすべてを選択対象としたk-近傍則により内挿および平滑化のために使用する移動ベクトルを決定していたが, 本論文で提案する手法はMAP推定時に得られる学習データの個数に基づき選択した信頼度の高い移動ベクトルに対してk-近傍則を用いることにより, 移動ベクトルの信頼度をより積極的に利用した移動ベクトル場平滑化を実現するものである. 提案の手法により移動ベクトル選択を行わない場合と同等の認識性能が約半分の音声データ量で実現できることを単語音声認識実験により示す.
- 社団法人電子情報通信学会の論文
- 1997-10-25
著者
-
飯田 正幸
三洋電機株式会社ハイパーメディア研究所
-
大倉 計美
三洋電機株式会社 研究開発本部 ヒューマンエコロジー研究所
-
飯田 正幸
三洋電機(株)ハイパーメディア研究所
-
飯田 正幸
三洋電機株式会社
-
大倉 計美
三洋電機(株)ハイパーメディア研究所
-
大倉 計美
三洋電機株式会社 技術開発本部 デジタルシステム技開センタービジネスユニット
関連論文
- 時間差適応型話速変換技術の開発
- HK-1-7 ユーザの潜在的な興味を導き出すTV番組推薦システムの構築(HK-1.Needsからみたユビキタス環境構築術,グループ特別企画,ソサイエティ企画)
- TV番組推薦システムの構築とその有用性の検証(誘うインタフェース(3), 誘うインタフェース(Inviting Interface), および一般)
- HMnetによる音素内セグメンテーションを用いた音声辞書の圧縮
- ディジタル携帯電話機用音声情報処理技術 (情報通信特集)
- 音声信号処理プロセッサの開発
- フィルタバンクピーク強調MFCCにおける耐雑音性の検討
- 音素識別誤り情報に基づく平滑化制御を用いたVFS話者適応化
- 信頼度に基づく移動ベクトル選択を用いたVFS話者適応化手法
- 移動ベクトル選択と誤識別情報に基づく移動ベクトル場平滑化話者適応
- 音素識別誤りに基づく平滑化制御を用いた移動ベクトル場平滑化話者適応
- 音素識別誤りに基づく平滑化制御を用いた移動ベクトル場平滑化話者適応
- 複数代表話者の話者空間移動ベクトルに基づく不特定話者HMMの話者適応化
- 音声切り出し誤りを考慮したニューラルネットの耐雑音性能評価
- 話者空間移動ベクトルに基づく話者適応化法の一検討
- ニューラルネットによる, 音声切り出し誤りを考慮した不特定話者単語音声認識についての検討
- 複数代表話者の話者空間移動ベクトルに基づく不特定話者HMMの話者適応
- 小型化・低価格を実現した音声認識ボ-ド--特徴と使用方法
- 高齢者による電話向け話速変換音声の評価実験 : 人にやさしい電話機の開発