低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出

スポンサーリンク

概要

論文の詳細を見る
非定常騒音は雑音のパワーレベルの変動が激しく, 周波数スペクトルも多様であるため, 定常雑音を仮定した音声区間検出法では, 十分な音声区間の検出精度を得ることは困難である. また, 高騒音環境下では無声音は雑音と区別しにくく, 無声音を含めた区間検出では誤検出が避けられない. これらの問題に対して, 有声音特有の高調波構造に着目し低域周波数帯における線形予測モデルの予測残差を利用することによって, 有声音区間を検出する手法を提案する. 線形予測分析の対象とする周波数帯域を低域に限定することにより, 広帯域を使用する場合と比較して有声音と雑音の分離特性が向上すると共に, 計算量も低減する. 機械加工工場の非定常騒音環境下で男性話者3名がそれぞれ発声した100単語を用いた実験によると, 単語区間 (無声音区間を除く) の検出率79.0%が得られ, 本手法の有効性が確認された.
1997-01-25

著者

関連論文

もっと見る

スポンサーリンク