周波数領域における混合音声の分離

スポンサーリンク

概要

論文の詳細を見る
音声認識システムでは、周囲に雑音が存在すると認識率が大幅に低下してしまう.複数の人が音声認識システムを利用するような環境では、入力音声に周辺の人の音声が重畳してしまい誤認識をしてしまう.この様な環境でも音声認識システムを効率的に使うためには、入力音声から周辺の人の音声を分離する必要があり、混合音声の分離方法を確立することが求められる.そこで本稿では、周波数振り分けによるマルチチャンネルの混合音声の分離法を提案する.これは、Caoらが提案する固有分解法の周波数領域での解釈から導がれる.本手法は、入力音声をFFTにより周波数領域に変換し、各周波数成分が元々どのチャンネルの成分だったのかを判断して、周波数の振り分けを行うことにより音声分離を行う.独立成分分析(ICA)との性能比較、計算機シミュレーションにおける実験結果、および実環境での実験を通して、本提案手法の有効性を明らかにする.
社団法人電子情報通信学会の論文
2001-03-22

著者

関連論文

もっと見る

スポンサーリンク