検索質問多重化による高速なオーディオ指紋検索
スポンサーリンク
概要
- 論文の詳細を見る
In music information retrieval, a huge search space has to be explored because a query audio clip can start at any position of any music in the database, and also a query is often corrupted by highly significant noise and distortion. Audio fingerprints have attracted much attention recently for providing compact representation of the perceptually relevant parts of audio signals. In this paper, we propose an extremely fast method of exploring a huge hamming space for audio fingerprinting systems. The effectiveness of our method has been evaluated by experiments using databases of 8,740 real songs and 800 artificially corrupted and 268 real queries.
- 2012-09-01
著者
関連論文
- 知能エージェント及び工学部ナビゲーションシステムの開発
- PPM^*言語モデルを用いた日本語単語分割
- PPM^*モデルによる日本語単語分割
- 単語の位置情報に基づくコーパスからのコロケーションの自動抽出
- 単語の出現位置情報を用いたコーパスからのコロケーションの自動抽出
- 文字クラスモデルによる日本語単語分割
- 文字クラスモデルに基づく日本語単語分割
- 感情認識及び感情創生に基づく知的学内案内ロボットの構築
- 講義映像配信システムにおける講義映像と資料の対応
- フィルタバンク特徴量とEarth Mover's Distanceを用いた音楽検索
- 教師あり学習によるベクトル空間情報検索モデルの精度改善
- 音程に注目した歌唱音声中の音符区間推定
- 仕事量基準を用いたコーパスからの定型表現の自動抽出
- 6X-5 オントロジーに基づく多様な発話に対応した対話システムの構築(対話,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1U-1 LSP係数の性質を考慮した音声符号化の改善(音声分析・強調,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5T-2 音程変化に基づく歌唱音声の音符区間検出(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 1N-4 感情の表出ができる学内案内ロボットの構築について(システム評価,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- D-020 WWW画像検索システムにおける有害画像フィルタリング手法(D分野:データベース)
- 発話タイプ付きコーパスを用いた確率的対話モデルの自動生成
- 確率・統計的手法による対話構造のモデル化
- 確率・統計モデルの音声言語処理への応用 ( 「コーパスに基づく音声・自然言語処理」)
- 音声言語の確率モデル ( 「コーパスに基づく音声・自然言語処理」)
- 単語の出現位置情報を用いたコーパスからのコロケーションの自動抽出
- Earth Mover's Distance の高速検索ライブラリ fastEMD の開発
- 字幕付き映像データからの字幕領域の検出手法
- 中国の自然言語処理について
- MPEG映像データに対するカットシーンの高速検出手法
- コーパスごとの類似度を考慮した用例に基づく感情推定手法の改善
- 距離反比例型スコアを導入したコロケーションの自動抽出法
- 自由発話音声認識における音響分析の比較
- World Wide Webからの対訳データの自動収集
- 情報検索のための概念ベクトル生成手法
- PDDPによる概念ベクトルを用いた情報検索システム
- PDDPによる概念ベクトルを用いた情報検索システム
- ランダム・プロジェクションによるベクトル空間モデルの次元削減
- オーディオ指紋検索に適した高速なハミング空間検索
- LRパーザ制御によるOne-pass型連続音声認識アルゴリズム
- 工学部案内の国際化対応プロジェクト
- サポートベクターマシンによる適合性フィードバックを用いた情報検索
- ETSI標準分散音声認識フロントエンドを用いた音声認識実験
- 音素依存線形判別分析の検討
- Simple PCAを用いたベクトル空間情報検索モデルの次元削減
- Non-negative Matrix Factorizationを用いた情報検索
- 情報検索システムの統計的手法による特徴と精度の分析
- ランダム・プロジェクションによるベクトル空間情報検索モデルの次元削除
- 解散フーリエ変換を用いたベクトル空間モデルの次元削減
- 教師あり学習によるベクトル空間モデルの精度改善
- クラスタリングに基づくGMM学習法による話者モデルの構築(話者認識・照合,認識,理解,対話,一般)
- 検索質問多重化による高速なオーディオ指紋検索
- E-011 楽曲検索インデックスのコンパクト化(音楽情報科学(2),E分野:自然言語・音声・音楽)