有声音の調波構造を利用した雑音に頑健な音声区間検出手法
スポンサーリンク
概要
- 論文の詳細を見る
(財)九州システム情報技術研究所にて開発された騒音下音声認識システムを用いて,入力信号に音声信号が含まれる区間の検出を行う処理を作成し,その性能に関する定量的評価を行った。この騒音下音声認識システムは,入力された音声信号に含まれる調波構造を検出し,音声特徴ベクトルを推定するものである。音声区間の検出のためには,音声特徴ベクトルの推定よりも音声の調波構造,および基本周波数の推定を高精度で行う必要がある。そこで,本システムではこの騒音下音声認識システムを基本周波数の推定用に特化させるように修正し,さらに音声区間の検出処理を作成した。提案手法の検出性能の評価を複数の男性話者による発話音声を用いて行った結果,クリーン音声に対しては従来法と比較して約11%の検出性能の向上が示され,また,騒音が重畳された音声に対しては,従来法と比較して,SNR(signal to noise ratio)が10dBの条件と0dBの条件でそれぞれ約3%の検出性能の向上が示された。さらに本システムは従来法と比較してより安定して音声区間の検出を行うことができることも示された。
- 九州産業大学の論文
著者
関連論文
- 授業評価アンケートデータから見えてくるもの : 講義科目に焦点をあてた分析
- 有声音の調波構造を利用した雑音に頑健な音声区間検出手法
- Model Fitting for the Crossmodal Attraction in Sensorimotor Synchronization