隠れマルコフモデルによる自動和音認識を用いたカバー演奏ストリームからの楽曲同定手法の検討(持続可能な社会に貢献するパターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
カバー演奏ストリームから自動的に,ほぼ実時間で楽曲同定を行う手法について,従来手法を改善する手法を提案する.従来手法は,特徴量の変化の影響を受けやすいため精度が低く,計算量が多い,また,標準パターンをあらかじめ人手で分割しておく必要があるといった問題があった.そこで,本研究では,原曲とカバー演奏の間で保存されている可能性が高い和音進行を隠れマルコフモデル(HMM)によって自動認識し,認識した和音進行パターンを用いて楽曲同定を行う手法を提案する.提案手法は,転置インデックスを用いたテキストベースの候補パターン削減と,ShiftCDP法を用いた音響的類似度によるスコアリングの2段階に分けることで高速化を実現し,標準パターンの切り出しも不要である.本稿では,原曲とカバー楽曲が対になったデータセットを用いて評価実験を行い,提案手法の有効性を示す.
- 一般社団法人電子情報通信学会の論文
- 2012-12-06
著者
関連論文
- マルチモーダル情報処理の研究動向(マルチモーダル)
- 筋電位を利用したサポートベクターマシンによる手のリアルタイム動作識別(福祉工学)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 語彙フリー音声文書検索手法における新しいサブワードモデルとサブワード音響距離の有効性の検証(音声言語)
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 並列分散遺伝的アルゴリズムにおける多層リング型トポロジの探索性についての考察
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- 3T-1 毒キノコ識別支援ツールのための毒キノコ判定方式の検討(検出・抽出,学生セッション,人工知能と認知科学)
- 連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索(認識,理解,対話,一般)
- 3X-4 カオスニューラルネットワークを用いた自動音楽コード生成の有効性について(音楽情報科学(2)自動作曲・楽曲分析,学生セッション,人工知能と認知科学)
- 6T-1 並列分散GAにおける多層型トポロジに関する考察(GA・エージェントモデル,学生セッション,人工知能と認知科学)
- 曲内類似性,GMM,類似区間継続長を用いた曲境界の自動抽出方式の提案(音声対話・セグメンテーション)
- ニュース番組の情報を利用したスポーツ実況中継のハイライトシーン抽出法の提案(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- サブワードを用いた音声文書検索における複数サブワードの統合 : サブワード毎の検索語検索性能期待値の利用(認識,理解,対話,一般)
- 音声検索システムのための時間整合を考慮したサブワードモデル構築手法の検討(検索・対話)
- 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用(要約, 検索, 認識・理解・対話・一般)
- 曲内の類似性を用いた曲境界の検出性能の向上
- デコンボルーションによる声道形の推定と適応型音声分析システム
- 音声認識の応用システム : 音声ドキュメント検索・音声翻訳・音声対話の新たな展開(自動音声認識研究の動向と展望)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 日本語母語話者の英語発声におけるプロソディ特性 : 母語話者英語と日本人英語のプロミネンス比較(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声合成システム性能評価方法の規格
- 調音の構造的制約を考慮した音声特徴抽出の検討
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 共通中間音声符号系を用いた音声認識方式
- 音声の調音符号化におけるセグメント特徴
- 調音-ホルマント・ノモグラムによる音声の調音符号化
- 声帯振動の非線形効果に基づく音声分析合成システム
- ホルマント解析における声道パラメータモデルの話者適応化
- 声帯振動の非線形効果を考慮した音声合成法とその評価
- ホルマント・ノモグラムによる音声パラメータの調音解析の検討
- 声帯振動の非線形性を考慮した音声合成法とその評価実験
- 基本波フィルタリング法による精細ピッチパターンの抽出
- 一般化声道モデルに基づく音声の規則合成システム (電子計算機相互運用デ-タベ-スシステム)
- 語彙制限のない音声文書検索における複数サブワードの統合----検索語彙に依存した検索性能推定指標の導入
- 音声文書検索のための多言語音素片セグメントの応用(ポスターセッション)(第5回音声言語シンポジウム)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用
- 音声認識技術とその応用,現状と課題
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 信頼度測定の音声データ検索システムへの応用
- AR-HMMに基づいた利得とAR係数の適応推定について
- 講演音声中の繰り返し言葉抽出による頻出単語区間の同定
- 汎用音声符号系への符号化と音声処理システムの構築
- 利得適応型AR-HMM分解法によるモノラル混合音分離について
- 言語に共通な音声符号系を用いた音声検索システム
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- 日本語母語話者の英文発声におけるピッチパターンの統計的分析(聴覚・音声・言語とその障害,一般)
- 境界音場制御の原理に基づく2次元スピーカアレーと楕円形制御点配置を用いた指向性制御の数値的検討
- 1019 筋電義手のための筋電位信号に基づく手の動作意図の推定(OS28-2:最近の筋活動計測とその応用2)
- 講義のユニバーサルデザインを目指した情報提示方法に関する検討(障害者教育/一般)
- H-013 配置と個人特徴の誇張を利用した似顔絵作成システム(画像認識・メディア理解,一般論文)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- 4U-6 並列分散遺伝的アルゴリズムにおける群構造化による探索性能への影響に関する考察(遺伝的アルゴリズム(1),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 4R-5 ビデオ内音響情報の時空間配置を特徴量とした一致区間検索方式の評価(マルチメディアデータ検索,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 2C1-4 筋電に基づく手の動作識別法の前腕切断者を対象とした有効性の検討(OS2-1:筋電義手I,オーガナイズドセッション)
- 1D-5 個人特徴の誇張を利用した似顔絵作成システムの評価(顔・人物画像処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- F-002 並列分散遺伝的アルゴリズムにおける多層リング型トポロジのパラメータについての考察(人工知能・ゲーム,一般論文)
- 駆動源に着目した時間領域での混合音分離 : 利得適応型AR-HMM分解法
- 駆動源に着目した時間領域での混合音分離 : 利得適応型AR-HMM分解法
- HMMによる音源のモデリングと高基本周波数に頑健な声道特性抽出
- AR-HMM 分解法とその音源分離への応用
- AR過程とHMMを組み合わせた音声波形モデリングとその同定法
- EA2000-40 HMMによる音源のモデリングと高基本周波数に頑健な声道特性抽出法
- 三軸マイクロフォンアレイを用いた三次元ポインティング音声インタフェースの開発(福祉と音声処理,一般)
- セグメント単位の音声符号列からのレキシコンの生成
- 言語系特性の違いから予測する日本人英語発声の韻律特徴 : 音声分析再合成システムを用いた実験的検証(一般)
- MF143 表情筋および頸部の筋電位信号を利用した日本語母音の識別(MF14 情報・コミュニケーション支援,あたり前のことを知る)
- 頸部から計測した筋電位信号を利用した発話認識
- 前腕切断者を対象とした筋電位信号に基づく手の動作識別法に関する基礎的研究
- 境界音場制御の原理に基づく二次元スピーカアレイによる指向性制御システムの試作
- 日本語テキスト音声合成用記号の標準化
- 境界音場制御の原理を用いた全方位音響マルチビームフォーミングシステムの開発
- 移動ロボット遠隔操作のための広視野生成手法の提案
- 音声認識の研究と実用化(音叉)
- 音声中の検索語検出における事前検索・HMM状態系列照合・リランキングの適用
- 音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式
- 隠れマルコフモデルによる自動和音認識を用いたカバー演奏ストリームからの楽曲同定手法の検討(持続可能な社会に貢献するパターン認識)
- 隠れマルコフモデルによる自動和音認識を用いたカバー演奏ストリームからの楽曲同定手法の検討(持続可能な社会に貢献するパターン認識)
- 音声中の検索語検出における音素トライグラム照合による高速抽出法(ポスターセッション)
- 類似音節バイグラムリストを用いた音声中の検出語検出
- 類似音節バイグラムリストを用いた音声中の検出語検出