Δ-logF0に基づく韻律特徴量を用いた耐雑音性の高い声調認識(耐雑音性)
スポンサーリンク
概要
- 論文の詳細を見る
中国語やタイ語などの声調言語では,声調を認識するために,音声の基本周波数に基づく韻律特徴量が用いられている.しかし,実環境雑音下においては,基本周波数の推定精度の劣化が,声調認識精度に悪影響を与える問題がある.また,話者やイントネーションによる基本周波数の変動を正規化する処理によって,韻律特徴抽出の実時間性が損なわれる問題もある.これらの問題を解決するため,我々は基本周波数の対数の時間変化量(Δ-logF0)に基づく韻律特徴量に着目する. Δ-logF0は,基本周波数やその対数に比べて話者性やイントネーションの影響を受けにくく,遅延を伴う正規化処理を行う必要がない.そのため,遅延時間の小さい韻律特徴量の抽出が可能である.さらに我々は,耐雑音性の高いΔ-logF0推定手法として,対数周波数軸上の周波数スペクトルのシフト量推定に基づく手法を提案する.マンダリンの認識実験の結果,提案手法により推定したΔ-logF0に基づく韻律特徴量が,従来のlogF0に基づく韻律特徴量に対して高い耐雑音性を示すことを確認した.
- 社団法人情報処理学会の論文
- 2008-07-11
著者
関連論文
- 適応学習を用いた音響モデルの言語間適応手法の開発(音響モデル)
- Δ-logF0に基づく韻律特徴量を用いた耐雑音性の高い声調認識(耐雑音性)
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 識別的特徴抽出に基づく音声区間検出の検討(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 音節継続長比モデルを用いた音声認識の検討(ポスターセッション)(第6回音声言語シンポジウム)
- KL展開と一般化確率降下法によるセグメント量子化の高速化
- 高速版SMQ/HMMによる不特定話者音声認識
- 複数特徴の重み付き統合による雑音に頑健な発話区間検出(耐雑音)
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 非音声区間情報を用いた補助関数型独立ベクトル分析による音声強調(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)