拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,複数話者による同時発話音声の単一チャネル信号に対する音声分離への拡張を念頭に置いた,混在する複数の基本周波数(F_0)の推定アルゴリズムについて述べる.音声韻律(F_0パターン)の時間連続性はF_0推定の際有用な情報であると考えられるが,今回は初期段階として各短時間分析窓それぞれ独立に処理を行うことを考える.まず,複数の調波構造が混在したスペクトルのモデルを,単一の調波構造をモデル化した拘束つき混合正規分布モデルを混合することで定式化する.このモデルのパラメータに関する最尤推定と情報量規準に基づくアルゴリズムにより,各分析窓において発話者数とそれぞれのF_0およびスペクトル形状が検出できる.また,F_0を連続値として高精度に推定できるという特徴をもつ.動作実験として話者一人による発話音声および話者二人による同時発話音声に対してCepstrum法との比較を行い,大きく上回る結果を得た.
- 社団法人電子情報通信学会の論文
- 2003-12-11
著者
関連論文
- 音楽知識に基づく音高・音長の組合せ特徴量を用いたMIDIデータからの作曲家判別(音楽解析)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 文字構造の文法記述に基づくオンライン手書き漢字列認識(テーマセッション4,文字・文書の認識・理解)
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 日本語歌詞からの自動作曲(音楽とOR)
- テンポ曲線と隠れマルコフモデルを用いた多声音楽MIDI演奏のリズムとテンポの同時推定(演奏認識/合成,便利で身近な音楽情報処理)
- ラジオ放送番組におけるスポーツ実況中継の分析(視覚障害/聴覚障害,一般)
- ラジオ放送番組におけるスポーツ実況中継の分析
- 調波音・打楽器音分離手法を用いた音楽音響信号からの自動和音認識(音響分析一般(2))
- Orpheus : 歌詞の韻律に基づいた自動作曲システム(自動作曲)
- 1.多重音解析と自動採譜(音楽情報処理技術の最前線)
- 早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般)
- 視覚障害者の聴覚認知の解明と音声対話への利用に向けて(ヒューマンコミュニケーショングループ (HCG) シンポジウム)
- 対面朗読者と視覚障害者の対話の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- HP-1-5 ラジオ放送支援システム「オラビー」の開発(HP-1.放送メディアにおける福祉情報の現状と可能性,パネル討論,ソサイエティ企画)
- 自動採譜技術の展望
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション,手,顔,身体表現の認識,理解)
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション2)
- 4.インターネットと音声合成(バリアフリー社会に向けた音声情報処理)
- スペクトル制御エンベロープによる混合音中の周期および非周期成分の選択的イコライザ
- 音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
- 超早口音声の聴取における単語親密度の教示効果
- 音韻修復効果を用いた音声CAPTCHAの検討
- 音韻修復効果を用いた音声CAPTCHAの検討(高齢者の認知機能保障技術及び一般)
- 超早口音声の聴取における単語親密度の教示効果(高齢者の認知機能保障技術及び一般)
- 第46回ヒューマンインタフェース学会研究会報告
- 探索的検索のための音声入力インタフェースの検討
- マルコフ確率場を用いた調認識、自動和声付け、および自動対位法
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 調波時間構造化クラスタリング(HTC)による音楽音響特徴量の同時推定
- 7. 擬人化音声対話エージェント(音声情報処理技術の最先端)
- 音声CAPTCHAシステムにおける削除法と混合法の比較(福祉と音声処理,一般)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 調波時間構造化クラスタリングによるCASAへのアプローチ
- 調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析(音楽音響信号処理 (2))
- 新博士によるパネルディスカッション1「博士への道のりと将来の夢」(パネルディスカッション)
- AS-6-3 EMアルゴリズムを用いた最尤時間周波数マスキングによる雑音環境下での2ch BSS(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- ハーモニッククラスタリングと情報量規準による音楽の音高/音源数の推定(山下記念研究賞受賞記念講演)
- 音声認識技術を用いた音楽情報処理
- Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換(音楽音響信号認識)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- ハーモニック・クラスタリングによる多重音信号音高抽出における音源数とオクターブ位置推定(音楽音響信号認識/生成1)
- ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
- ハーモニッククラスタリングによる多重音の基本周波数推定
- 歌唱曲自動作曲の需要と今後 - 2年間のOrpheus運用を通じて
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- 単旋律と和音の確率モデルの組み合わせによるピアノ曲演奏の自動表情付け
- 無限状態スペクトルモデルによる音楽音響信号の解析
- 可変基底NMFに基づく音楽音響信号の解析
- 非和声音規則に基づく経路制約を用いた旋律自動生成
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 手の自然な動きを考慮した隠れ変数付き隠れマルコフモデルに基づくピアノ運指決定(ピアノ)
- 隠れマルコフモデルに基づくピアノ運指の自動決定
- 第53回WIT研究会におけるリアルタイム映像配信の報告
- 単旋律と和音の確率モデルの組み合わせによるピアノ曲演奏の自動表情付け
- 音声認識読み記号および音声関連ソフトウエアに係わる用語の試行標準案
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 歌唱曲自動作曲の需要と今後 : 2年間の Orpheus 運用を通じて
- 複素スペクトル円心(CSCC)の推定に基づくマイクロホンアレーによる雑音抑圧
- 複素スペクトル円心(CSCC)の推定に基づくマイクロホンアレーによる雑音抑圧
- モルフォロジ収縮処理と構造特徴複製に基づく画像インペインティング(一般セッション,手,顔,身体表現の認識,理解)
- 動的計画法に基づく自動対位法
- 動的計画法と音列出現確率を用いた対位法の対旋律の自動生成(音楽生成・システム)
- 周波数領域のDPマッチングによる自然楽器演奏の和音ピッチ推定
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 確率モデルによる多声楽曲MIDI演奏からの楽譜推定
- 相平面に描かれるF_0の動的変動成分を利用した歌唱様式の自動分類
- 音声インタフェースのための対話負荷測定法(音声,聴覚)
- 正弦波重畳モデルのパラメータ最適化アルゴリズムの導出(ブラインド信号処理/一般)
- 音声スパース性に基づく2chBSSへのEMアルゴリズムの適用(ブラインド信号処理/一般)
- 事後確率最大化Specmurt分析による多重ピッチの反復推定アルゴリズム
- 凸射影法に基づくSpecmurt分析の共通調波構造推定
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 擬人化音声対話エージェントにおける視線制御方法の検討
- 音声対話における擬人化エージェントの利用効果の検討
- ISO/IEC MPEG-4 Audio Lossless Coding (ALS)におけるチャネル内とチャネル間の長期予測(国際標準に向けたテレコム技術とその効用論文)
- 多チャンネル時系列信号のロスレス符号化
- チャネル間相関を用いた多チャネル信号の可逆圧縮符号化(産学連携論文)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声の聴取訓練における単語親密度の影響(一般(ポスターセッション),第9回音声言語シンポジウム)
- 早口音声聴取における単語親密度と学習効果の検討
- 早口音声聴取における単語親密度と学習効果の検討
- 確率文脈自由文法を用いた和声学規則の表現と楽曲の自動和声解析(表情付け・分析)
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- ガウス基底音響ストリームモデルを用いた時空間クラスタリングによる多重スペクトル分離
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(ポスターセッション)(第5回音声言語シンポジウム)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定
- F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定
- 声質空間上での変換に基づく歌声らしさの転写に関する検討
- 楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜
- 補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 入出力隠れマルコフモデルの復号によるギターのための自動編曲
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)
- モンドリアンHMMによる音楽信号の解析(テーマセッション,自然言語とパターン認識の境界)