SP2000-16 楽曲の高速検索手法の検討
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、楽曲の高速検索のためのアルゴリズムの提案およびその評価について報告する。今回提案するアルゴリズムは、楽曲データベース中から与えられた検索セグメントが含まれる曲・場所を検索するものであり、曲名の決定、概略な始終端位置の検出、詳細な始終端位置の検出という3段階から構成されている。PC(Linux)上にて行なった評価では、データベース上のデータとは別経路で得た10秒間の楽曲検索セグメントを検索した結果、認識率が94.22%、検索時間が約136秒であった。
- 社団法人電子情報通信学会の論文
- 2000-06-16
著者
-
杉山 雅英
会津大学コンピュータ理工学部
-
杉山 雅英
会津大学大学院コンピュータ理工学研究科
-
成田 智也
会津大学
-
成田 智也
会津大学コンピュータ理工学研究科
-
杉山 雅英
会津大学
-
成田 智也
会津大
関連論文
- 話者認証を用いたX Window施錠システムxvlock : 開発とその評価
- 話者認証を用いたX Window 施錠システム xvlock 開発とその評価(バリアフリーインタフェース, および一般)
- Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
- N信号源モデルに基づく音声の区分化識別問題 : 話者特徴の違いに基づく区分化音声の識別
- 音声研究の現状と課題
- 音声/非音声区間検出のための自動モデル学習法の評価(音声言語,情報処理技術のフロンティア)
- 複数時系列中の類似セグメント高速探索法 : 3つの時系列に対する実装と評価(認識,理解,対話,一般)
- 類似セグメント探索RDDS法の評価(第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 類似セグメント探索RDDS法の評価(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声研究会報告 : 解説と展望
- 音声/非音声区間検出のための自動モデル学習法の評価(特徴量, 区間検出)
- 譜面情報による楽曲の特徴付けの検討
- 譜面情報による楽曲の特徴付けの検討
- Top-down的音韻認識に基づく単語音声認識
- トップダウン処理による音韻認識
- 字幕表示のためのVCMLプロジェクトの研究開発の現状 : 環境情景音表示とVCML文書の木構造化
- VCML Player字幕生成のための笑い声の検出
- VCML Player 字幕生成のための笑い声の検出
- 字幕表示システムVCML Playerの新機能について
- 音声と音楽のセグメンテーションの最適化
- 音楽と音声のセグメンテーションの最適化
- SP2000-17 Cepstrum Fluxを用いた音声と音楽のセグメンテーション
- 1K-4 標本化周波数識別法の雑音下音声に対する評価
- 音声の標本化周波数の自動識別方法
- 時間拘束条件下での重畳音声分解法の高速化(認識・理解・対話)
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- パワー情報を用いた楽曲検索法
- SP2000-16 楽曲の高速検索手法の検討
- 時系列の歪み一定区分化法とセグメント探索における評価(一般, 一般, チュートリアルレクチャー)
- 字幕表示のための音声とテキストの自動対応付け手法とその評価
- Cepstrum Fluxを用いた音声区間の検出
- 話者認識を用いたコンピュータセキュリティシステムの評価
- 音響シーンセグメンテーション法の検討
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声/非音声判別法を用いた時間圧縮音声再生法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音声認識のためのマルチマイクロホンシステム : 第2部 超接話マイクロホンと音声認識実験結果
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- セグメント高速探索法とその評価(Session-2 情報検索, 第7回音声言語シンポジウム)
- Video Caption Player 2.4 : 複数字幕同時表示機能の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 書き起しテキストのある音声ドキュメントの検索
- 音声とテキストの自動対応付けによる音声インデキシング手法とその評価(要約, 検索, 認識・理解・対話・一般)
- テキスト情報を利用した音声インデキシング
- 長時間音声字幕化のための朗読単位への区分化
- 字幕表示用言語VCMLの設計とその表示システムの開発
- 字幕自動生成における字幕と音声の時間軸整合の検討
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 任意個数の時系列に含まれる類似部分探索法(システム,第9回音声言語シンポジウム)
- 音声区間検出のためのVQ符号帳の自動学習
- 時間拘束条件下でのモデルを用いた重畳音声分解法
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- 出現確率の幾何学的性質を用いたセグメント高速探索法(テーマセッション: 時系列・大規模メディア処理, データ工学とメディア理解との融合)
- Active探索におけるノルムと類似度との関係(聴覚・音声・言語とその障害, 一般)
- 音響情報の検索
- 複数時系列中の類似セグメント高速探索法(情報検索)
- 類似セグメント高速探索法における球被覆の検討(認識,理解,対話,一般)
- 距離に基づくActive探索法の計算量について(認識・理解・対話・一般)
- 複数時系列中の類似セグメント探索法の提案と評価(聴覚・音声・言語とその障害,一般)
- Active探索法による出現確率時系列の区分化とクラスタリング(一般, STRAIGHTスペシャルセッション(SS))
- 量子化ひずみ最小の原理に基づく母音標準パタ-ンの教師なし学習法 (音声認識)
- LPCスペクトルマッチング尺度のcentroidとその単語音声認識への適用
- WLR尺度による単語音声認識
- WLR尺度による単語音声認識
- 単語音声認識におけるLPCスペクトル・マッチング尺度の評価
- 周波数軸重み付けLPCスペクトルマッチング尺度
- ピ-クに重みをおいたLPCスペクトルマッチング尺度
- 5N-9 手話パターン間距離の導出
- 音響情景字幕表示のための笑い声の検出
- 2T-2 インターネット対応音響効果支援ツールキットの開発
- セグメントの高速探索法
- セグメントの高速探索法
- Java言語を用いたInternet対応しりとりゲーム
- ビデオデータにおける指定人物の検出と追跡 : 音声部分を用いた処理
- 音響シーンセグメントの接続の検討