拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)

スポンサーリンク

概要

論文の詳細を見る
本報告では,複数話者による同時発話音声の単一チャネル信号に対する音声分離への拡張を念頭に置いた,混在する複数の基本周波数(F_0)の推定アルゴリズムについて述べる.音声韻律(F_0パターン)の時間連続性はF_0推定の際有用な情報であると考えられるが,今回は初期段階として各短時間分析窓それぞれ独立に処理を行うことを考える.まず,複数の調波構造が混在したスペクトルのモデルを,単一の調波構造をモデル化した拘束つき混合正規分布モデルを混合することで定式化する.このモデルのパラメータに関する最尤推定と情報量規準に基づくアルゴリズムにより,各分析窓において発話者数とそれぞれのF_0およびスペクトル形状が検出できる.また,F_0を連続値として高精度に推定できるという特徴をもつ.動作実験として話者一人による発話音声および話者二人による同時発話音声に対してCepstrum法との比較を行い,大きく上回る結果を得た.
社団法人電子情報通信学会の論文
2003-12-11

著者

関連論文

もっと見る

スポンサーリンク