時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)

概要

論文の詳細を見る
本論文は時間拘束条件下での重畳音声分解法とその評価について述べる。本論文の目的は二人の話者による重畳音声を各々の音声にスペクトル領域で分離することである。従来法は自己相関係数で保持された符号帳を利用し、瞬時音響情報と時間拘束条件を用いて音声の分離を行う。従来法の処理の削減のため、木構造符号帳を用いた2段探索アルゴリズムと2種類の処理削減法を提案する。実験としてランダムに選んだ100単語対を各々の話者のスペクトルに分離した。評価はSpectrum Deviation Rateに基づいて行う。従来法では大きさ256の符号帳を用いた時の分離歪みは5.82dBであり、分析フレーム毎に222.23秒の処理時間が必要であった。今回提案した2段探索アルゴリズムでは64×64の木構造符号帳を用いた時、分離歪みは5.49dBであり1.78秒の処理時間となった。この時、分離対象を母音のみと限定したときの分離歪みは4.54dBであった。また、処理削減法を用いる事によって128×32木構造符号帳を用いた時、分離歪みは5.39dB、処理時間は1.01秒の結果を得た。従来法に対し、本論文が提案する木構造符号帳を用いた2段探索アルゴリズムと2種類の処理削減法は0.43dBの分離歪み減少と200倍以上の処理の高速化を実現した。
2003-05-23

時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク