拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(ポスターセッション)(第5回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,複数話者による同時発話音声の単一チャネル信号に対する音声分離への拡張を念頭に置いた,混在する複数の基本周波数(F_0)の推定アルゴリズムについて述べる.音声韻律(F_0パターン)の時間連続性はF_0推定の際有用な情報であると考えられるが,今回は初期段階として各短時間分析窓それぞれ独立に処理を行うことを考える.まず,複数の調波構造が混在したスペクトルのモデルを,単一の調波構造をモデル化した拘束つき混合正規分布モデルを混合することで定式化する.このモデルのパラメータに関する最尤推定と情報量規準に基づくアルゴリズムにより,各分析窓において発話者数とそれぞれのF_0およびスペクトル形状が検出できる.また,F_0を連続値として高精度に推定できるという特徴をもつ.動作実験として話者一人による発話音声および話者二人による同時発話音声に対してCepstrum法との比較を行い,大きく上回る結果を得た.
- 一般社団法人情報処理学会の論文
- 2003-12-18
著者
関連論文
- 音楽知識に基づく音高・音長の組合せ特徴量を用いたMIDIデータからの作曲家判別(音楽解析)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 文字構造の文法記述に基づくオンライン手書き漢字列認識(テーマセッション4,文字・文書の認識・理解)
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 日本語歌詞からの自動作曲(音楽とOR)
- テンポ曲線と隠れマルコフモデルを用いた多声音楽MIDI演奏のリズムとテンポの同時推定(演奏認識/合成,便利で身近な音楽情報処理)
- ラジオ放送番組におけるスポーツ実況中継の分析(視覚障害/聴覚障害,一般)
- ラジオ放送番組におけるスポーツ実況中継の分析
- 調波音・打楽器音分離手法を用いた音楽音響信号からの自動和音認識(音響分析一般(2))