エネルギー変化の線形予測符号化に基づくリズム特徴量を用いた音楽印象識別
スポンサーリンク
概要
- 論文の詳細を見る
本論文では音楽の印象識別を高精度で行う特徴量として,線形予測符号化に基づくリズム特徴量(Rhythm feature based on Linear Predictive Coding:RLPC)を提案する.RLPCは,音響信号のエネルギー変化に対して線形予測符号化を適用することにより求められるケプストラムであり,音楽におけるリズムの周期性をとらえることが可能である.7つの印象に対する音楽印象識別実験により,ジャンル分類ならびに印象分類における5種類の従来のリズム特徴量との比較を行った.実験結果より,RLPCを用いた場合の平均識別率は83.7%であり,従来のリズム特徴量を用いた場合より1.3ポイント高い識別率が得られた.さらに,音量・音色・和音特徴量にRLPCを併用した場合の平均識別率は89.5%であり,音量・音色・和音特徴量のみを用いる場合と比較して2.0ポイント,従来のリズム特徴量を併用した場合よりも0.6ポイント高い識別率が得られた.また,各印象においてRLPCと従来のリズム特徴量で仮説検定を行った結果,4種類の従来のリズム特徴量に対して,RLPCを用いた場合の識別精度が有意であった.
- 2013-04-15
著者
関連論文
- AIBOにおけるRBFネットワークと粒子フィルタを用いた顔検出
- AIBOにおけるRBFネットワークと粒子フィルタを用いた顔検出 (産業計測制御研究会 モーションコントロール、センサ応用、信号処理応用、生体信号処理など)
- AIBOにおける無線LANを利用した処理システムの構築
- AIBOにおける無線LANを利用した処理システムの構築 (産業計測制御研究会 計測・センサ応用,モーションコントロール全般)
- 脳波の個人特性とユーザのエゴグラム得点との関連性
- ステレオ画像を用いた姿勢変動に頑健な手形状推定
- 自己組織型ニューラルネットワークによるSAR画像での流氷識別
- 距離索引VP-treeにおける解絞込みの一改良手法(マルチメディアデータベース,データ工学論文)
- 複数特徴に基づく見た目年齢推定
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 個人特性を考慮した潜在構造モデルによる音楽聴取時の脳波特徴抽出法と客観的評価方法
- 印象判断を目的とした顔の重要計測部位解析に関する研究
- 人の視知覚特性に基づく視認困難な画像に対するマーカの配置とその検出法
- 顔特徴が人の年齢認知に及ぼす影響の解析
- 人間が年齢知覚に用いる特徴量の解析
- A-15-25 顔特徴が人の年齢知覚に及ぼす影響の解析(A-15. ヒューマン情報処理,一般セッション)
- H-023 GAとLVQを用いた見た目年齢推定(H分野:画像認識・メディア理解)
- SPCA と RGA を用いた個人認証のための特徴抽出法
- SPCAとRGAによる特徴抽出を用いた個人同定
- 2-303 特徴抽出法に基づく個人同定法
- 人の視知覚特性に基づく視認困難なキャリブレーションパターン
- 赤外線画像を用いた監視システムの提案
- 最大距離アルゴリズムを用いた風景画像の領域分割
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験(一般(ポスターセッション),第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 音楽検索のための楽曲印象値の自動付与手法
- フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索
- 教師あり学習によるベクトル空間情報検索モデルの精度改善
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 順位統計量を用いた話者照合のためのコホート話者選択方法
- 実用的脳波計測装置を用いた音楽聴取時における脳波分析
- 符号化音声認識のための合成音声を用いた不特定話者音響モデルの適応法(音声,聴覚)
- 分散音声認識における実時間周波数特性正規化手法(音声言語)
- 脳波を用いた過矯正におけるテクノストレスへの影響解析(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 脳波センシングシステムを用いた感覚の分類
- 風景画像検索のための遺伝的アルゴリズムを用いた画像領域の色特徴量取得
- SVMを用いた時変複素音声分析による曲調解析
- 画像による質感解析手法の検討
- ADS-1-9 生体信号識別のための高速な特徴抽出アルゴリズム(ADS-1.信号処理のための機械学習,シンポジウムセッション)
- ADS-1-9 生体信号識別のための高速な特徴抽出アルゴリズム(ADS-1. 信号処理のための機械学習,シンポジウムセッション)
- パターン認識における追加学習法(機械学習によるバイオデータマインニング,一般)
- ハミングによる検索機能を備えた音楽配信システムの開発
- サフィックス・アレイに基づく言語モデルを用いた音声認識に関する研究
- 検索質問と字幕の文字画像特徴量間の距離に基づく字幕検索手法
- 多数の話者モデル内での順位情報を用いた話者照合
- AIBOにおけるRBFネットワークを用いた顔検出
- 曲調解析に基づく音楽分析法の提案(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 順位統計量を用いた話者照合のためのコホート話者選択方法 (音声)
- ニューラルネットワークを用いた音楽聴取時の脳波解析(機械学習によるバイオデータマインニング,一般)
- 改良型強化学習による腎臓領域の自動検出
- ピッチ検出器とニューラルネットワークを用いた感情音声の認識
- GAと Simple PCA を用いた表情認識の一手法
- 脳波センシングによる気分一致・不一致刺激の検出
- A-15-24 顔印象解析における顔部位の重要性解析(A-15. ヒューマン情報処理,一般セッション)
- 遺伝的閾値決定法に基づく超高速な対象物検出法
- 2-304 遺伝的閾値決定法を用いた車のナンバープレート検出
- 多変量解析による音楽聴取時の脳波分類
- 脳波の個人特性推定モデルとその評価方法に関する一考察
- 遺伝的アルゴリズムを用いた音声波形学習法の検証
- 超音波心エコー画像を用いた心臓の輪郭抽出
- X線画像における左心室領域の自動抽出
- 心臓疾患の自動検出の一手法
- 風景画像におけるキーワード検索のためのキーワード抽出法
- AIBOにおけるRBFネットワークを用いた顔検出
- 脳波の個人特性を考慮した脳波分析法の提案
- 因子分析とニューラルネットワークを用いた脳波パターンの特徴抽出
- 2-305 因子分析と NN を用いた脳波解析
- 2-314 ハイブリット型 GA によるシステム同定と PID 制御系の設計
- 順位統計量を用いたテキスト独立型話者照合手法(音声,聴覚)
- 進化的アルゴリズムにより構造化されたニューラルネットワークからのルール抽出の一方法
- 遺伝的画像解析による肌のキメの測定
- 静・動判別型ニューラルネットワークによる指文字の認識
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- EMGの遺伝的解析法
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果
- 脳波を用いた過矯正におけるテクノストレスへの影響解析
- エネルギー変化の線形予測符号化に基づくリズム特徴量を用いた音楽印象識別
- 話者認識におけるロバストネス(話者認識に関する研究の動向)
- 話者認識技術の現状と課題(オーガナイズドセッション(パネルディスカッション),音声アプリケーション,一般)
- 音声ドキュメント検索における種々の検討および線形補間係数を自動決定する検索質問拡張