歌波形データのフレームワイズな音素識別に基づく検索(音声言語応用)
スポンサーリンク
概要
- 論文の詳細を見る
本稿の目的は, 「フレームワイズな音素識別ラベルを用いた音声検索」の方式を歌声データ検索に適用し, その有用性を調べることである.すなわち, フレームワイズに音素ラベル化された歌声データを検索対照データとし, クエリーとしての歌声データを検索対象データと同様に処理した後, クエリー列を用いてデータベースから連続DPによってスポッティング認識することで類似した部分区間の検索を行い, 抽出された区間を含む楽曲を検索するものである.楽曲データベース全体から歌声クエリーを用いた楽曲検索率は, 4小節分のクエリーで78%であった.また、音声クエリーとの検索率の違いも本稿では述べる.
- 一般社団法人情報処理学会の論文
- 2005-07-15
著者
-
矢口 勇一
会津大学
-
岡 隆一
会津大学
-
岡 隆一
会津大学コンピュータ理工学部
-
矢口 勇一
会津大学コンピュータ理工学部
-
矢口 勇一
会津大学 コンピュータ理工学部
-
岡 隆一
会津大学大学院コンピュータ理工学研究科
-
岡 隆一
会津大学大学院 コンピュータ理工学研究科
関連論文
- Web中にあるビデオデータからの感性情報の検索(テーマセッション,映像ハンドリング技術とその応用)
- 画像間のピクセル最適対応を用いた少数枚数画像による3次元形状復元(テーマセッション3,アンビエント環境知能)
- 画像間のピクセル最適対応を用いた少数枚数画像による3次元形状復元(テーマ関連セッション3)
- 4-3 Webからの音響と映像の感性検索(4.感性データベース,感性情報学)
- 2次元連続DPを用いた凹凸参照画像のPixel対応スポッティング認識(映像・マルチメディアとパターン認識・理解)
- 2次元連続DPを用いた凹凸参照画像のPixel対応スポッテイング認識(映像・マルチメディアとパターン認識・理解)
- 会議音声データの収録とデータファイル化
- Gesture interface (特集 2001年の映像情報技術)
- ニュース音声コーパスの構築
- Non-monotonic連続DPによるスポッティングに基づく自律移動ロボットの時系列画像を用いた大局的位置の推定
- 2次元連続DPによる画像のスポッティング認識
- 全方位視覚センサを用いた大局的位置の推定
- ジェスチャ動画像の逆時間動作や静止動作をスポッティング認識するためのNon-monotonic連続DP
- タスクに依存しないモデルに基づいた動画像による実時間位置同定
- フレーム特徴の音素記号化に基づく語彙に依存しない音声検索
- Web中にあるビデオデータからの感性情報の検索(テーマセッション,映像ハンドリング技術とその応用)
- Web中にあるビデオデータからの感性情報の検索(テーマセッション,映像ハンドリング技術とその応用)
- 画像間のピクセル最適対応を用いた少数枚数画像による3次元形状復元(テーマセッション3,アンビエント環境知能)
- 移動カメラを用いた城郭建築の3次元形状復元システム(テーマセッション2,移動カメラ画像処理におけるパターン認識とメディア理解)
- 歌波形データのフレームワイズな音素識別に基づく検索(音声言語応用)
- 歌波形データのフレームワイズな音素識別に基づく検索(合成・生成,韻律,一般)
- 気の長い話(編集委員今年の抱負2009:経糸から横糸まで)
- 2次元連続DPを用いた凹凸参照画像のPixel対応スポッテイング認識(映像・マルチメディアとパターン認識・理解)
- 連続DPの一般スキームについて : 画像スポッティングための全画素最適マッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 連続DPの一般スキームについて一画像スポッティングための全画素最適マッチング(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 音声によるテキスト検索について
- 残るものと残らないもの(編集委員今年の抱負2011)
- 2次元連続DPによる画像のスポッティング認識
- 2次元連続DPによる画像のスポッティング認識
- ビデオ画像におけるテロップ領域抽出とOCR適用との統合処理(映像・マルチメディアとパターン認識・理解)
- 1P1-S-070 連続DPによる骨導音声コマンドの認識(進化・学習とロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- リアルワールドコンピューティングプロジェクトから見えてきたもの : 実世界知能化技術等の開発 : ユーザの獲得と実用化に向けて進展中
- 2次元連続DPを用いた動画像における変形物体のスポッティング認識と追跡(マッチングとパターン認識)(映像・マルチメディア処理とパターン認識・理解及び一般)
- 2次元連続DPを用いた動画像における変形物体のスポッティング認識と追跡(マッチングとパターン認識)(映像・マルチメディア処理とパターン認識・理解及び一般)
- 2次元連続DPを用いた動画像における変形物体のスポッティング認識と追跡(マッチングとパターン認識)(映像・マルチメディア処理とパターン認識・理解及び一般)
- 画像とテキストの関連についての特性解析(一般セッション(1), 産業応用とパターン認識・メディア理解)
- 画像とテキストの関連についての特性解析
- 画像に付属するテキストのクラスタリングを用いた画像の類似性抽出とその評価(映像・マルチメディアとパターン認識・理解)
- 画像に付属するテキストのクラスタリングを用いた画像の類似性抽出とその評価(映像・マルチメディアとパターン認識・理解)
- 2次元連続DP(2DCDP)のハードウェア実装による高速化とメモリ使用量の軽減(システムと信号処理及び一般)
- 2次元連続DP(2DCDP)のハードウェア実装による高速化とメモリ使用量の軽減(システムと信号処理及び一般)
- 2次元連続DP(2DCDP)のハードウェア実装により高速化とメモリ使用量の軽減(システムと信号処理及び一般)
- 2次元連続DP(2DCDP)のハードウェア実装による高速化とメモリ使用量の軽減(システムと信号処理及び一般)
- P223 月探査データを用いたGISベース協働環境システムの構築(ポスターセッション2)
- 人工知能の中のインターネット技術(編集委員2007年の抱負)
- セグメンテーションと認識ではどちらが先に処理される?(ようこそ人工知能の世界へ : 編集委員今年の初夢)
- セグメンテーションと認識ではどちらが先に処理される?
- パターン情報から情報統合へ向けて : 場という概念を中心に
- 小特集「情報統合への視点」にあたって
- やさしさ難しさで人工知能のテーマー覧表をつくってみると
- 連続DPによる画像処理
- 時空間系列パターンのスポッティング認識(テーマセッション,時系列パターン認識)
- 発音習得のための超音波舌画像に対する音素片マッピング(テーマセッション,時系列パターン認識)
- 発音習得のための超音波舌画像に対する音素片マッピング(テーマセッション,時系列パターン認識)
- 時空間系列パターンのスポッティング認識(テーマセッション,時系列パターン認識)
- 移動体の頑健なトラッキング
- 発音習得のための超音波舌画像に対する音素片マッピング
- 宇宙ハッカソン報告
- 連続DPによる画像処理
- ネットワークセントリックに関連する情報の動的関連づけのための情報基盤
- 3 グラフデータベースを用いたサービス疎結合支援基盤(III-3 電子自治体,セッションIII,自由報告)
- 発音習得のための超音波舌画像に対する音素片マッピング
- 移動体の頑健なトラッキング
- 時空間連続DPを用いた動画像からの空中文字認識(テーマセッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
- フィギュアスケート放送映像からの演技動作のスポッティング認識(人体・動作の認識と理解,福祉と共生,国際会議報告)
- 対象物に依存しない画素の系列モデルを用いた時空間連続DPによる動き認識(テーマセッション,一人称ビジョン,セキュリティとプライバシーの確保,産学共同研究紹介)
- 移動するカメラによる動画像からの動作のスポッティング認識(テーマセッション,一人称ビジョン,セキュリティとプライバシーの確保,産学共同研究紹介)
- 宇宙ハッカソン報告