AR-GARCHモデルに基づいた音声区間検出手法の提案(音声,聴覚)

スポンサーリンク

概要

論文の詳細を見る
実環境における目的音声区間検出は,様々な音声信号処理の基盤技術と考えられるが,従来の音響特徴量に基づく技術では,強い背景雑音があるような実環境において必ずしも十分に動作せず,有効な音響特徴量に対して検討の余地がある.人の発声する音声時系列の頻度分布の形状は中心のひずむすその重い分布を示している.音声が常に背景雑音に埋もれる状況を想定するとそのような統計的性質をもつ時系列が検出されるべき目的音声となる.そこで本論文では,音響信号を自己回帰-一般化自己回帰条件付分散不均一(AR-GARCH)モデルでモデル化し,GARCHモデル部で推定された条件付分散値を音響特徴として用い,区間検出を行う手法を提案した.SN比OdBの背景雑音を含む実際の音響信号を用いた評価実験を行い,従来の国際標準化規格と比べ本手法により音声区間検出精度が10パーセント以上改善されることを示した.
2007-12-01

著者

関連論文

もっと見る

スポンサーリンク