ガウス混合モデルを用いた楽曲のコード認識(信号処理,LSI,及び一般)

元データ 2003-06-20

概要

本論文では,ガウス混合モデル(GMM)を用いて楽曲のコードを認識する手法を提案し,実験検討結果を報告する.フレーム分割した入力音響信号を,フィルタバンクを用いてオクターブ毎に分割し,各オクターブから12音名に対応するパワースペクトルを12次元のベクトルとして抽出する.このベクトルより混合重み,平均ベクトル,共分散行列を求め,ガウス混合モデルを形成する.さらにN-gramモデルを併用することにより,コード進行を考慮したモデルとする.以上より,未学習の音域に対して適応可能であり,将来的に複雑な構成音の場合やリアルタイムでの認識を考慮した手法を提案する.

著者

白井 啓一郎 信州大学工学部
池原 雅章 慶應義塾大学理工学研究科
菅野 真音 慶應義塾大学
白井 啓一郎 慶應義塾大学
長井 隆之 電気通信大学
池原 雅章 慶應義塾大学 大学院 理工学研究科
菅野 真音 慶應義塾大学理工学部電子工学科
池原 雅章 慶應義塾大学

関連論文

▼もっと見る