ハーモニック・クラスタリングによる多重音の基本周波数推定アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,複数音源による多重音のモノラル音響信号に対して,基本周波数を推定する手法を提案する。1つのクラスタが基本周波数の近傍および倍音周波数の近傍の周波数帯域によって構成されると見なすことにより,クラスタ内のスペクトル成分のクラスタリングを行うことができる。このようなアプローチを,ハーモニック・クラスタリングと呼ぶ。個々のスペクトル成分をいずれか1つのクラスタのみに割り当てるのではなく,複数のクラスタが確率的な尺度により共有するように扱うことで,このクラスタリングはEMアルゴリズムとして定式化ざれる.本手法を用い,独唱および多声音楽のモノラル音響信号から基本周波数推定を行い,性能の検証を行った。倍音構造の変化が著しい無伴奏歌唱に対し90.6%の音名正解率を得た。また,ビブラートやグリッサンドのようなピッチ変動が含まれるヴァイオリン三重奏に対し83.2%の音名正解率を得た。
- 一般社団法人情報処理学会の論文
- 2003-05-16
著者
-
篠田 浩一
東京工業大学情報理工学研究科計算工学専攻
-
篠田 浩一
東京工業大学
-
亀岡 弘和
NTTコミュニケーション科学基礎研究所
-
西本 卓也
東京大学大学院情報理工学系研究科
-
嵯峨山 茂樹
東京大学大学院情報理工学系研究科
-
亀岡 弘和
東京大学大学院情報理工学系研究科
関連論文
- シンボル列化したシーンの学習と2種のプレイ種相関度による野球放送映像プレイ種識別(画像・映像処理)
- 局所的な特徴と大局的な特徴を用いた監視カメラ映像からの行動イベント検出 (医用画像)
- SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出(テーマセッション関連,一般物体認識・画像特徴量)
- 畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法(音響分析一般(1))
- CHLAC特徴と隠れマルコフモデルを用いたGait認識(一般セッション2,複合現実感のためのパターン認識・理解)
- 統計的モデル選択によるシーン数の自動推定を用いた動画要約(一般セッション3,複合現実感のためのパターン認識・理解)
- 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 音声とペン入力の同時入力に対する認識方式の検討(認識・理解・対話・一般)
- 音や映像から「部品」を取り出すメディアシーン学習技術 (特集 「見る・見せる」技術の最先端)