Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,音楽音響信号をノート単位で編集できるインタフェースの実現を目的とし,音楽音響信号を個々のノートに対応する音響信号に分離する問題に対し,スペクトログラムを階層的なパーツ表現により構成する階層的スパース表現の概念に基づく新しい解法を検討する。音楽のスペクトログラムを,I 個の振幅スペクトルパーツと J 個の時間エンベロープパーツで構成されるものと仮定してスペクトログラムをモデル化し,パラメータの最適化アルゴリズムを導出する。この最適化アルゴリズムでは,各々のスペクトルパーツやエンベロープパーツは,与えられた音響信号を構成する典型的なパーツとなるよう学習される。これらのパーツを個別操作し,その操作を音響信号出力に反映するインタフェース"Music Factorizer" を実装する。
- 2009-07-22
著者
-
柏野 邦夫
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
大石 康智
名古屋大学大学院情報科学研究科
-
亀岡 弘和
NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
亀岡 弘和
日本電信電話株式会社
-
ルルー・ジョナトン
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
ルルー ジョナトン
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
亀岡 弘和
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
柏野 邦夫
Ntt コミュニケーション科学基礎研
-
亀岡 弘和
東京大学大学院情報理工学系研究科|nttコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 音響指紋技術とその応用
- Bonada,J. and Serra,X., Synthesis of the singing voice by performance sampling and spectral models(初音ミクはどのようにして歌を歌うの?誰でも使いやすい歌声合成システム「VOCALOID」の舞台裏),IEEE Signal Processing Magazine, Vol.24,Iss.2, pp.67-79, 2007
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)