曲内類似性,GMM,類似区間継続長を用いた曲境界の自動抽出方式の提案(音声対話・セグメンテーション)
スポンサーリンク
概要
- 論文の詳細を見る
記憶媒体の大容量化に伴い,録画保存した番組を簡易に閲覧し,選択的に観られる機能が望まれる.筆者らは,音楽番組中の楽曲を抽出するため,一つの曲内の類似性と曲と曲の間の非類似性により,曲境界を抽出する曲内類似法を提案した[1].また曲内類似法に加え,音響的特徴を頑強に識別可能なGMMを導入し,音声/音楽境界の高精度化を図った[2].一つの楽曲内での楽器の切り替わりや転調時に起こる誤ったセグメンテーションをこれらの方法でも全て抑えることができない.本稿では,繰り返されている長めのメロディを認識し,その区間を一つの楽曲として捉えることで解決を図る.任意の長さで同一/類似区間を照合可能なRelay Continuous Dynamic Programing (Relay CDP)法[3]を導入し,一楽曲の纏まりを複数のメロディから捉える連続類似区間強調法を提案する.連続した音楽データ,音楽と会話が交互に現れるデータを用いて楽曲の境界抽出実験を行い,曲内類似法,GMM判定方式と共に連続類似区間強調法を用いることによって境界抽出性能の向上を確認した.
- 社団法人情報処理学会の論文
- 2008-02-08
著者
-
石亀 昌明
岩手県立大学ソフトウェア情報学部
-
伊藤 慶明
岩手県立大学ソフトウェア情報学部
-
小嶋 和徳
岩手県立大学
-
小嶋 和徳
岩手県立大学ソフトウェア情報学部
-
吉田 拓真
岩手県立大学ソフトウェア情報学研究科
-
伊藤 慶明
岩手県立大
-
石亀 昌明
岩手県立大学
関連論文
- マルチモーダル情報処理の研究動向(マルチモーダル)
- 脳波情報及び印象評価結果に基づく音楽コード進行パターン自動生成プログラムの作成
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 語彙フリー音声文書検索手法における新しいサブワードモデルとサブワード音響距離の有効性の検証(音声言語)
- 並列分散遺伝的アルゴリズムにおける多層リング型トポロジの探索性についての考察
- 3T-1 毒キノコ識別支援ツールのための毒キノコ判定方式の検討(検出・抽出,学生セッション,人工知能と認知科学)
- 階層サーバ・クライアント型モデルによる非同期並列分散遺伝的アルゴリズム
- 連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索(認識,理解,対話,一般)
- 3X-4 カオスニューラルネットワークを用いた自動音楽コード生成の有効性について(音楽情報科学(2)自動作曲・楽曲分析,学生セッション,人工知能と認知科学)
- 6T-1 並列分散GAにおける多層型トポロジに関する考察(GA・エージェントモデル,学生セッション,人工知能と認知科学)
- 曲内類似性,GMM,類似区間継続長を用いた曲境界の自動抽出方式の提案(音声対話・セグメンテーション)
- ニュース番組の情報を利用したスポーツ実況中継のハイライトシーン抽出法の提案(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- F-036 大規模問題における階層型並列分散遺伝的アルゴリズムの影響についての考察(F分野:人工知能・ゲーム)
- サブワードを用いた音声文書検索における複数サブワードの統合 : サブワード毎の検索語検索性能期待値の利用(認識,理解,対話,一般)
- 音声検索システムのための時間整合を考慮したサブワードモデル構築手法の検討(検索・対話)
- 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用(要約, 検索, 認識・理解・対話・一般)
- 曲内の類似性を用いた曲境界の検出性能の向上
- F-037 階層型サーバ・クライアントモデルによる並列分散遺伝的アルゴリズム(F.人工知能)
- 岩手県立大学ソフトウェア情報学部の紹介
- 遺伝的アルゴリズムにおける大域探索と局所探索両面を考慮した適応型HRG選択法の提案
- 遺伝的アルゴリズムにおけるSRG選択法の提案
- 音声認識の応用システム : 音声ドキュメント検索・音声翻訳・音声対話の新たな展開(自動音声認識研究の動向と展望)
- Web上の語彙を利用した音声クエリ拡張による検索語検出 (言語理解とコミュニケーション)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 語彙制限のない音声文書検索における複数サブワードの統合----検索語彙に依存した検索性能推定指標の導入
- 音声文書検索のための多言語音素片セグメントの応用(ポスターセッション)(第5回音声言語シンポジウム)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用
- 信頼度測定の音声データ検索システムへの応用
- 講演音声中の繰り返し言葉抽出による頻出単語区間の同定
- 汎用音声符号系への符号化と音声処理システムの構築
- 言語に共通な音声符号系を用いた音声検索システム
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- ビデオ内一致区間検索のための音響情報の時空間配置照合方式(一般セッション,クロスモーダル)
- 講義のユニバーサルデザインを目指した情報提示方法に関する検討(障害者教育/一般)
- H-013 配置と個人特徴の誇張を利用した似顔絵作成システム(画像認識・メディア理解,一般論文)
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- Web上の語彙を利用した音声クエリ拡張による検索語検出(音声検索・要約,第11回音声言語シンポジウム)
- 4U-6 並列分散遺伝的アルゴリズムにおける群構造化による探索性能への影響に関する考察(遺伝的アルゴリズム(1),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 4R-5 ビデオ内音響情報の時空間配置を特徴量とした一致区間検索方式の評価(マルチメディアデータ検索,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 1D-5 個人特徴の誇張を利用した似顔絵作成システムの評価(顔・人物画像処理(1),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- F-002 並列分散遺伝的アルゴリズムにおける多層リング型トポロジのパラメータについての考察(人工知能・ゲーム,一般論文)
- 4X-4 多点局所探索法による画像高解像度化における評価画像選定方法についての検討(画像処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- I-071 動画検索のためのMPEG-2データ中の特徴量抽出方法の検討(I分野:グラフィクス・画像,一般論文)
- 米国大学の入試調査に基づく入試・教育システムに関する一考察
- 音声ドキュメント検索テストコレクションの試作と基本検索性能評価
- F-047 PDGAにおける階層コーン型トポロジの探索空間拡大に伴う探索性能の影響に関する考察(F分野:人工知能・ゲーム,一般論文)
- E-018 カオスニューラルネットワークを応用した自動リズム生成システム(E分野:自然言語・音声・音楽,一般論文)
- 2Y-5 形状・色特徴を利用した毒キノコ識別支援ツールの評価方法に関する研究(物体認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 2D-2 カオスニューラルネットワークにおけるパラメータの検討 : 自動作曲への応用を目指して(音声・音楽情報処理,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- H-051 形状特徴を利用した毒キノコ識別支援ツールのための毒キノコ判定方式の検討(画像認識・メディア理解,一般論文)
- 曲内類似性,GMM,類似区間継続長を用いた曲境界の自動抽出方式の提案(音声対話・セグメンテーション)
- I-007 音響情報の時空間配置照合によるビデオ間の部分一致検索(グラフィクス・画像,一般論文)
- 語彙非依存型音声文書検索のためのサブワードモデルおよび検索方式の検討
- 芸術家の技術保存用ビデオデータベースの構築・公開・研究計画
- 遺伝的アルゴリズムの最適解到達性能についての考察
- MPEG-1/2中の直流成分を利用した動画検索方式の評価
- 2K-5 HRG選択法 : 遺伝的アルゴリズムにおける選択法の改良
- 時系列パターンの任意部分区間の高速マッチング手法Shift CDP法(パターン認識)
- 類似区間の検出法Shift CDPの性能評価と講演音声への適用
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 9-4 多点局所探索法を用いた画像高解像度化における評価方法に関する考察(第9部門 メディア処理4)
- 音声中の検索語検出のためのテストコレクションの構築と分析
- 音声ドキュメント処理ワーキンググループ活動報告
- 重複区間抽出法 Shift CDP 法を用いた講演音声のダイジェスティング
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声中の検索語検出における事前検索・HMM状態系列照合・リランキングの適用
- 音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式
- 隠れマルコフモデルによる自動和音認識を用いたカバー演奏ストリームからの楽曲同定手法の検討(持続可能な社会に貢献するパターン認識)
- 隠れマルコフモデルによる自動和音認識を用いたカバー演奏ストリームからの楽曲同定手法の検討(持続可能な社会に貢献するパターン認識)
- 音声中の検索語検出における音素トライグラム照合による高速抽出法(ポスターセッション)
- 類似音節バイグラムリストを用いた音声中の検出語検出
- 類似音節バイグラムリストを用いた音声中の検出語検出