チュートリアル:非負値行列因子分解
スポンサーリンク
概要
- 論文の詳細を見る
本チュートリアルでは,近年音響信号処理分野で広く用いられるようになった非負値行列因子分解について説明する。音楽音響信号の任意の短時間フレームにおけるスペクトルには,一般に複数の楽音スペクトルが混在しており,個々のスペクトルを分離抽出することは難しい。ここでもし,全フレームの観測スペクトルが比較的少数の楽音スペクトルだけで構成されていて,各フレームにおける観測スペクトルがこれらを適当な 「ミキシングバランス」 で混ぜ合わせたものと仮定できるならばどうだろうか。各楽音スペクトルの推定値が既に得られているなら,各フレームの観測スペクトルに当てはまるように,それぞれの楽音スペクトルのミキシングバランスを推定してやることで各楽音に帰属するスペクトルへの分解が可能になるし,このとき観測スペクトルに十分うまく当てはまらないのであれば,うまく当てはまるように各楽音スペクトル推定値を再度求め直してやることで分解精度をさらに高めることができるだろう。実は,観測スペクトログラムを行列と見なして非負値行列因子分解の反復アルゴリズムを適用することは,これらの処理ステップを繰り返し行っていることに相当している。実際,音楽信号は,限られた種類の音高および楽器音のスペクトルしか出現しえない,という仮定がある程度成り立つ場合が多く,このことが音楽スペクトログラムの分解方法として非負値行列因子分解が有効である理由の一つである。本チュートリアルでは,非負値行列因子分解の基本性質,非負値制約によってもたらされる効果,分解表現を得るための反復アルゴリズムの導出方法などを概説した上で,非負値行列因子分解による具体的な応用例を紹介する。
- 2011-07-20
著者
関連論文
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 1.多重音解析と自動採譜(音楽情報処理技術の最前線)
- 自動採譜技術の展望
- スペクトル制御エンベロープによる混合音中の周期および非周期成分の選択的イコライザ
- 調波時間構造化クラスタリング(HTC)による音楽音響特徴量の同時推定
- 調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析(音楽音響信号処理 (2))
- AS-6-3 EMアルゴリズムを用いた最尤時間周波数マスキングによる雑音環境下での2ch BSS(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- ハーモニッククラスタリングと情報量規準による音楽の音高/音源数の推定(山下記念研究賞受賞記念講演)
- Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換(音楽音響信号認識)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- ハーモニック・クラスタリングによる多重音信号音高抽出における音源数とオクターブ位置推定(音楽音響信号認識/生成1)
- ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
- ハーモニッククラスタリングによる多重音の基本周波数推定
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- 無限状態スペクトルモデルによる音楽音響信号の解析
- 可変基底NMFに基づく音楽音響信号の解析
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 手の自然な動きを考慮した隠れ変数付き隠れマルコフモデルに基づくピアノ運指決定(ピアノ)
- 隠れマルコフモデルに基づくピアノ運指の自動決定
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 周波数領域のDPマッチングによる自然楽器演奏の和音ピッチ推定
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 正弦波重畳モデルのパラメータ最適化アルゴリズムの導出(ブラインド信号処理/一般)
- 音声スパース性に基づく2chBSSへのEMアルゴリズムの適用(ブラインド信号処理/一般)
- 事後確率最大化Specmurt分析による多重ピッチの反復推定アルゴリズム
- 凸射影法に基づくSpecmurt分析の共通調波構造推定
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析
- チュートリアル:非負値行列因子分解
- 半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索(一般セッション,PRMUのフロンティア・グランドチャレンジ)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(ポスターセッション)(第5回音声言語シンポジウム)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定(第5回音声言語シンポジウム : ポスターセッション)
- 拘束つき混合正規分布の最尤推定とAICによる同時発話複数音声のF_0推定
- F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定
- 声質空間上での変換に基づく歌声らしさの転写に関する検討
- 楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜
- 補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 数理モデルによる音楽情報処理(招待講演,時系列パターン認識)
- 入出力隠れマルコフモデルの復号によるギターのための自動編曲
- 手書き単語認識における解析的手法と全体的手法のベイズ決定則に基づいた統合フレームワーク(画像認識,コンピュータビジョン)
- 数理モデルによる音楽情報処理
- 非負値行列因子分解の音響信号処理への応用(近年の音響信号処理における数理科学の進展)
- A-4-5 非定常雑音・時変残響環境下でのパワースペクトログラム領域セミブラインド音声強調(A-4.信号処理)
- 手書き単語認識における解析的手法と全体的手法のベイズ決定則に基づいた統合フレームワーク