識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 音声認識のための雑音ロバストな音声区間検出方式を提案している.提案手法は, 入力信号の短時間エネルギーおよび音声/非音声GMMを用いた尤度比の二つの基準を用いてフレーム単位の音声/非音声を判別する.このとき, 尤度比を計算するためのパラメータを学習する手法として, 識別的特徴抽出(DFE : Discriminative Feature Extraction)を導入している.識別的特徴抽出は, 特徴抽出器と識別器を統一された枠組みで識別的に最適化する特徴を持っており, 音声認識および話者認識などの分野でその効果を示している.フレーム単位の音声/非音声判別性能を評価した結果, 提案手法は短時間エネルギーを基準とした手法と比較して高い性能を示した.また, 提案手法を用いることにより, 音声の始終端検出精度および雑音環境における音声認識性能も改善された.
- 一般社団法人情報処理学会の論文
- 2005-12-21
著者
-
河村 聡典
(株)東芝研究開発センター
-
河村 聡典
東芝研究開発センター
-
山本 幸一
東芝研究開発センター
-
Jabloun Firas
Speech Technology Group, Cambridge Research Laboratory, Toshiba Research Europe Ltd.
-
Reinhard Klaus
Speech Technology Group, Cambridge Research Laboratory, Toshiba Research Europe Ltd.
-
Jabloun Firas
Speech Technology Group Cambridge Research Laboratory Toshiba Research Europe Ltd.
-
Reinhard Klaus
Speech Technology Group Cambridge Research Laboratory Toshiba Research Europe Ltd.
関連論文
- 音声認識実用化技術の展開(総合報告)
- 適応学習を用いた音響モデルの言語間適応手法の開発(音響モデル)
- Δ-logF0に基づく韻律特徴量を用いた耐雑音性の高い声調認識(耐雑音性)
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 9 音声認識の多言語化技術(音声認識技術の実用化への取り組み)
- 競合MAP推定法を用いた話者・環境適応学習
- 音声認識の多言語化技術 (特集 音声認識技術の実用化への取り組み)
- オンライン重ね書き文字認識--小型携帯機器に適した文字入力インタフェース (特集 デジタルメディア処理先端技術)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- オンライン重ね書き文字入力インタフェースおよび認識方式
- オンライン重ね書き文字入力インタフェースおよび認識方式
- オンライン重ね書き文字入力インタフェースおよび認識方式
- 音声認識実用化技術の展開
- KL展開と一般化確率降下法によるセグメント量子化の高速化
- 高速版SMQ/HMMによる不特定話者音声認識
- 最小分類誤り学習による特徴選択型文字認識
- 最小分類誤り学習による特徴選択型文字認識
- 変形文字を用いた認識辞書の作成