周波数領域最小二乗法を用いる同時発話音声の分離抽出法
スポンサーリンク
概要
- 論文の詳細を見る
複数の話者が同時に発話した母音性の混合音声について,その話者音声を分離抽出する方法を提案している。音声の正弦波モデル表現に基づき,基本周波数及び高調波成分の複素振幅とも未知である場合に,混合音声の短時間フーリエ変換(STFT)データから周波数領域最小二乗法によってそれらを推定し,音声の分離抽出を行う。評価関数は,仮定した基本周波数とその高調波周波数位置に平行移動した窓関数のスペクトルを実際のSTFTデータに適合させるときの周波数領域の二乗誤差の総和で定義する。混合音声間に存在するレベル差の有無と評価関数の振る舞いに焦点をあてて,本方法の有効性を検討している。
- 1995-11-16
論文 | ランダム
- 洞察の計算モデル構築に向けて : Tパズルを題材として
- 表象変化の動的緩和理論 : 洞察メカニズムの解明に向けて
- 日常的な機器の操作の理解と学習における課題分割プラン
- 動的で、構成的な類似判断 : 思考の基盤としての類似が持つべき条件
- 49A. 十勝岳1988〜1989年噴火と降下火山灰に付着した可溶性成分(日本火山学会1989年秋季大会)