Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,音楽音響信号をノート単位で編集できるインタフェースの実現を目的とし,音楽音響信号を個々のノートに対応する音響信号に分離する問題に対し,スペクトログラムを階層的なパーツ表現により構成する階層的スパース表現の概念に基づく新しい解法を検討する。音楽のスペクトログラムを,I 個の振幅スペクトルパーツと J 個の時間エンベロープパーツで構成されるものと仮定してスペクトログラムをモデル化し,パラメータの最適化アルゴリズムを導出する。この最適化アルゴリズムでは,各々のスペクトルパーツやエンベロープパーツは,与えられた音響信号を構成する典型的なパーツとなるよう学習される。これらのパーツを個別操作し,その操作を音響信号出力に反映するインタフェース"Music Factorizer" を実装する。
- 2009-07-22
著者
-
柏野 邦夫
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
大石 康智
名古屋大学大学院情報科学研究科
-
亀岡 弘和
NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
亀岡 弘和
日本電信電話株式会社
-
ルルー・ジョナトン
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
ルルー ジョナトン
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
亀岡 弘和
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
柏野 邦夫
Ntt コミュニケーション科学基礎研
-
亀岡 弘和
東京大学大学院情報理工学系研究科|nttコミュニケーション科学基礎研究所
-
大石 康智
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 音響指紋技術とその応用
- Bonada,J. and Serra,X., Synthesis of the singing voice by performance sampling and spectral models(初音ミクはどのようにして歌を歌うの?誰でも使いやすい歌声合成システム「VOCALOID」の舞台裏),IEEE Signal Processing Magazine, Vol.24,Iss.2, pp.67-79, 2007
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- デモンストレーション:若手による研究紹介IV
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- 音声分離と楽音分離の統合のための音オントロジーの提案
- メディアコンテンツ特定技術の最新動向
- 認識理解への認知発達的アプローチ (パターン認識・メディア理解)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- AS-5-5 複合ソースフィルタモデルによる音響信号の三要素テンソル分解(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 実環境で収録された映像断片をキーとする一致映像探索(マルチメディア応用,画像の認識・理解論文)
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 幾何変換パラメータを特定する縮退生成探索法(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 音楽や映像の高速探索(工学と芸術を融合する若い息吹)
- ベイジアンネットワークの音響認識への応用
- SPIRE : スパースなインデキシングによる画像中の同一部分領域の検出(画像検索, 画像の認識・理解論文)
- サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法(画像処理・解析, 画像の認識・理解論文)
- Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し,合成できるインタフェース
- Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース
- 相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類
- 映像認識理解への認知発達的アプローチ(テーマセッション,パターン認識とメディア理解のフロンティアとグランドチャレンジ)
- Webから収集した楽曲を説明するテキストと楽曲の音響特徴量との関連づけに関する検討(音楽音響信号処理)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 実環境で受音した楽音をキーとする楽曲探索法(パターン認識)
- グローバルな枝刈りを導入した音や映像の高速探索
- 同じ音や映像を高速に探す技術--学習アクティブ探索法 (特集論文1 高度検索技術)
- 音や映像の高速探索のための動的分割に基づく特徴次元削減法
- 携帯カメラで収録した映像をキーとする一致映像探索
- グローバルな枝刈りを導入した音や映像の高速探索
- LI-18 携帯電話で受音した音をキーとする音響信号探索(I. 画像認識・メディア理解)
- 区分線形写像に基づく音響信号の高速探索
- 区分線形写像に基づく映像信号の高速探索
- 解説 確率ディザボーティング--低品質な映像も瞬時に探すためのコア技術
- R&Dホットコーナー 楽曲やCMの高速検索を実現する学習アクティブ探索ライブラリ--NTTコミュニケーション科学基礎研究所
- 音や影像を素早く探すメディア探索技術の未来 (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 時系列アクティブ探索法のための特徴ひずみに頑健な確率デイザボーテイング (画像の認識・理解論文特集)
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 重み付き特徴点照合に基づく高速画像検索(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- ベイジアンネットワークを用いたバイナリマスキングに基づく音源分離(耐雑音性)
- 線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- TRECVID 2010 Instance Searchタスク参加報告 (パターン認識・メディア理解)
- 相平面に描かれるF_0の動的変動成分を利用した歌唱様式の自動分類
- 主観評価に基づく楽曲間類似度算出モデル
- 相平面に描かれる歌声の基本周波数軌跡:歌唱者の意図する音高目標値系列の推定とハミング検索への応用
- AS-5-2 相平面を利用した歌声のF0軌跡の新しい表現方法(AS-5. 音響信号のモデリングと表現,シンポジウムセッション)
- 歌声の旋律と動的変動を特徴付けるための確率的な表現手法に関する検討(音楽音響信号処理 (1))
- 音声だけでシームレスにハミング検索と曲名検索が可能な楽曲検索システム
- スペクトル包絡と基本周波数の時間変化を利用した歌声と朗読音声の識別(音楽情報,情報処理技術のフロンティア)
- 単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別
- 局所的・大局的な特徴を利用した歌声と朗読音声の識別
- 多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法(音楽情報処理)
- 2値多重音響特徴ベクトルを用いた類似音楽探索とその高速化(マルチメディアパターン処理)
- モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索(IBIS2010(情報論的学習理論ワークショップ))
- 特徴歪みに頑健な部分空間を用いた携帯端末による音響信号探索
- 時系列アクティブ探索法に基づく音や映像の高速AND/OR探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- 音の流れを認識して楽器を聞き分けるコンピュータ (特集論文 ヒューマノイド・テクノロジー&サイエンス研究)
- 音や映像を瞬時に探す時系列アクティブ探索法
- ヒストグラム特徴を用いた音響信号の高速探索法 : 時系列アクティブ探索法
- オーバースキッピングによる時系列アクティブ探索法の高速化
- 時系列アクティブ探索法における音響信号の高速AND/OR探索
- 複数の音響信号の高速探索 -参照信号のOR探索における照合回数削減-
- 単音連繋確率ネットワークに基づく音楽演奏の音源同定
- マルチモーダルアクティブ探索を用いた画像・音響時系列の高速探索
- ヒストグラム特徴系列に基づく長時間音響信号の高速探索
- パート譜を用いたボーカル音 分離システム
- アンサンブル実演奏の自動アンミキサ
- 適応型混合テンプレートを用いた音源同定 : 複数楽器演奏への適用
- 多数の小区間信号の探索に基づく背景音楽の探索
- 多数の小区間信号の探索に基づく背景音楽の探索
- D-12-22 メディア探索のための曖昧文字列照合の高速計算法
- 類似度に基づく曖昧文字列照合法と音楽検索への適応
- DT-3-1 長時間メディアの高速時系列探索(DT-3. 長時間メディア処理のためのパターン認識・メディア理解の基盤技術, 情報・システム2)
- 音楽を聞き分けるコンピュータ(「音楽情報処理研究への誘い特集号」)
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化
- 適応的領域分割と初期しきい値推定によるテンプレートマッチングの高速化(画像・映像処理)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- TRECVID 2010 Instance Searchタスク参加報告(テーマセッション,映像処理とTRECVID)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 京都祇園祭における船鉾懸装品の超高精細分光画像撮影(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- R&Dホットコーナー ソリューション 分光画像撮影技術による文化財デジタルアーカイブ
- 音楽や映像を特定するメディア指紋技術とその応用(インダストリアルマテリアルズ)
- 多重領域ヒストグラムを用いた高速なウィンドウサーチ(物体認識,文字・文書,医用画像,第14回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法(一般セッション,人の視聴覚情報処理とPRMUの接点)
- 市街地構造物への拡張現実型画像情報提示手法