多数の小区間信号の探索に基づく背景音楽の探索
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,音声と音楽が混合した音響信号(蓄積信号)中の音楽信号を探索する手法とその高速化について述べる.ここで探索とは,与えられた音楽信号の断片を探索キー(参照信号)とし,参照信号を背景音楽(BGM)などとして含む蓄積信号中の区間を探索することである.本探索では,探索の目的となる参照信号を含む区間においても,他の音声信号の重畳により,その音響信号は参照信号と著しく異なり,参照信号を蓄積信号と直接照合する手法での探索は困難である.そこで,参照信号を多数の小領域信号に分割し,各小領域信号について類似度の高い区間のみを蓄積信号中で探索し,その探索結果を統合し,目的とする区間を探索する手法について述べる.本手法においては各小領域について類似度の高い区間のみを探索することで,この探索に高速な探索手法を用い,探索全体を高速に行うことを特徴とする.実験では,各小領域信号の探索に時系列アクティブ探索法を用いることで,約30分の蓄積信号からの15秒の参照信号の探索を約8秒で行うことができた.
- 社団法人電子情報通信学会の論文
- 2002-09-13
著者
-
柏野 邦夫
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
永野 秀尚
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
柏野 邦夫
日本電信電話(株)基礎研究所 情報科学研究部
-
永野 秀尚
NTTコミュニケーション科学基礎研究所
-
村瀬 洋
日本電信電話株式会社nttコミュニケーション科学基礎研究所:(現)名古屋大学大学院情報科学研究科
-
村瀬 洋
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
永野 秀尚
日本電信電話株式会社 Ntt コミュニケーション科学基礎研究所
-
柏野 邦夫
Ntt コミュニケーション科学基礎研
-
柏野 邦夫
日本電信電話(株)NTTコミュニケーション科学基礎研究所
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマセッション2,アンビエント環境知能)
- グラフコストの逐次更新を用いた映像顕著領域の自動抽出(画像映像解析,画像の認識・理解論文)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- 2値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)
- 音響指紋技術とその応用
- 視覚的注意の確率的モデル化のための動的マルコフ確率場(テーマ関連セッション2)
- 動的ベイジアンネットワークを用いた視覚的注意の確率モデル(一般,膨大なデータから学ぶもの)
- 適応型混合テンプレートを用いた音源同定 : 音楽演奏への適用