歌唱における表現意図を考慮した歌声<i>F</i><sub>0</sub>生成過程とその統計的モデリング
スポンサーリンク
概要
- 論文の詳細を見る
歌声 F0 軌跡における楽譜逸脱成分 (F0 動的変動成分) を楽譜情報と分離して抽出することを目的として,F0 軌跡の新しい生成過程モデルを提案する.従来,オーバーシュートのような音符の立ち上がりに関する F0 動的変動成分は 2 次系を用いてモデル化されたが,ビブラートやポルタメントのような意図的表現による変動成分および微細変動成分はすべて雑音としてモデル化された.提案する F0 生成過程は楽譜に記載される音符の並びを表現するノート指令信号と歌唱者の音楽的な表現意図を表す表現指令信号によって 2 次系が駆動されるモデルであり,ノート成分と表現成分を出力する.これらの成分とガウス性白色雑音に従う微細変動成分との和によって F0 軌跡を記述する.そのモデルパラメータを推定する逆問題の解法アルゴリズムを導出し,評価実験では,推定される表現成分に歌唱者の音楽的な表現意図が含まれるかどうかを客観的かつ主観的に評価して,提案モデルの有効性について議論する.
- 2012-01-27
著者
-
亀岡 弘和
日本電信電話株式会社
-
大石 康智
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
持橋 大地
大学共同利用機関法人情報・システム研究機構統計数理研究所
-
亀岡 弘和
日本電信電話株式会社NTTコミュニケーション科学基礎研究所|東京大学情報理工学系研究科
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 統計的手法による多重音解析に関する研究(研究会推薦博士論文速報)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 音声分離と楽音分離の統合のための音オントロジーの提案
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- 音楽情報検索コンテスト(2005〜2007)を通して見た音楽情報検索研究
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- 無限状態スペクトルモデルによる音楽音響信号の解析
- 可変基底NMFに基づく音楽音響信号の解析
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- 予測誤差のGolomb-Rice符号量を最小化する線形予測分析(電気音響,音響一般)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 全極型声道モデルとF_0パターン生成過程を内部にもつ統計的音声スペクトルモデル(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- D-12-22 メディア探索のための曖昧文字列照合の高速計算法
- 類似度に基づく曖昧文字列照合法と音楽検索への適応
- DT-3-1 長時間メディアの高速時系列探索(DT-3. 長時間メディア処理のためのパターン認識・メディア理解の基盤技術, 情報・システム2)
- 音楽を聞き分けるコンピュータ(「音楽情報処理研究への誘い特集号」)
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化(画像・映像処理)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- モンドリアンHMMによる音楽信号の解析 (パターン認識・メディア理解)
- モンドリアンHMMによる音楽信号の解析 (言語理解とコミュニケーション)
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ(物体認識,文字・文書,医用画像,第14回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 非負値行列因子分解の音響信号処理への応用 (小特集 近年の音響信号処理における数理科学の進展)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル
- ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
- ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 歌唱における表現意図を考慮した歌声F0生成過程とその統計的モデリング
- 正確な色再現を目的とした2眼ステレオ式6バンドビデオシステム(テーマセッション,実時間処理実空間センシングと環境理解)
- 市街地構造物への拡張現実型画像情報提示手法
- 市街地構造物への拡張現実型画像情報提示手法
- 複数カメラを用いた人数分布推定に関する検討(一般セッション,大規模データとパターン認識・メディア理解,地球をとらえる,CEATEC連携)