複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(ポスターセッション)(第5回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
様々な雑音条件に対してロバストな音声認識を実現するためには,複数の雑音抑圧手法の各々の認識結果から信頼度の高いものを選択する方法が有効であると考えられる.本稿では,フレーム正規化対数尤度に基づく信頼度を用いた認識結果の統合法を提案する.提案法では,正解と最もマッチする認識結果を得るために,各雑音抑圧手法を用いた時のN-bestの認識結果を求める.そして,各認識結果に対して信頼度を付与し,信頼度が最大になるものを選択する.提案法の有効性を評価するために,雑音下連続数字認識タスクであるAURORA-2Jを用いて評価実験を行った,その結果,特にMulticondition trainingの場合に提案法の有効性を確認することができた.
- 一般社団法人情報処理学会の論文
- 2003-12-18
著者
関連論文
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 雑音下音声認識のための複数の前処理手法の統合とそのAURORA-2Jによる評価
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- Eモデルにより算出される品質指標と主観評価値との相関に関する検討(リッチメディア,信頼性・セキュリティ,一般)
- D-14-16 フレーム正規化対数尤度に基づく信頼度を用いた単語レベルの認識結果の統合(D-14. 音声・聴覚, 情報・システム1)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(第5回音声言語シンポジウム : ポスターセッション)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(第5回音声言語シンポジウム : ポスターセッション)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討
- 低ビットレートオーディオ符号化方式と品質評価
- オーディオメディアの高品質圧縮符号化技術の動向
- IP電話の通話品質評価法に関する標準化動向(VR,ヒューマンファクタ,一般)
- IP電話の通話品質評価法に関する標準化動向(VR,ヒューマンファクタ,一般)