音声ドキュメント検索における種々の検討および線形補間係数を自動決定する検索質問拡張
スポンサーリンク
概要
- 論文の詳細を見る
近年,音声を含むマルチメディアコンテンツが身近な存在となり,それらを検索する音声ドキュメント検索に関する研究がさかんに行われるようになってきている.本論文では,2011年に開催されたNTCIR-9ワークショップのコアタスクSpokenDoc内のSDRサブタスクに参加した際に行った音声ドキュメント検索に対する種々の検討を報告する.検討内容はベクトル空間モデルによるテキスト検索において,索引語の単位,索引語重みづけ方法,ベクトル空間に射影する音声認識候補数,検索質問拡張方法などの比較である.これらの種々の検討結果に基づきNTCIR-9ワークショップのSpokenDocタスク内のSDRサブタスクに提出した検索結果は,NTCIR-9ワークショップから提供された音声認識結果を用いSDRサブタスクに参加した3機関(9結果)の中で最も高い検索精度を示した.本論文では,各ベクトル空間で計算される類似度を統合して音声ドキュメント検索を行うことを提案した.さらに,検索質問拡張における検索質問ベクトルと拡張ベクトルを結合する線形補間係数の自動決定手法を検討した.提案手法の有効性の検証および種々の検討ため,NTCIR-9のSpokenDocタスク内のSDRサブタスクを用いた音声ドキュメント検索実験を行った.実験結果より,音節を索引語とした場合,単語を索引語とした場合の両方において,索引語重みづけ手法TF-IDFが高い検索精度を示した.また,検索質問拡張に用いる文書は,収集範囲に制限を行わずインターネット上のWebページ全体を検索し,収集した場合に検索精度が高くなることが分かった.さらに,提案手法により各ベクトル空間で計算される類似度を統合して音声ドキュメント検索を行うことは,各ベクトル空間の検索結果を向上させることが分かった.
- 一般社団法人情報処理学会の論文
- 2014-06-15
著者
関連論文
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- 音声対話における発話タイミングの影響に関する知覚実験(対話・インタフェース・インタラクション)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境 (2)(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(第8回音声言語シンポジウム)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 音声認識における頑健性 : 音響分析・音響モデル,なにが課題か(企画)
- 自動車運転のマルチモーダル信号収録装置の開発(マルチモーダルシステム,システム開発論文)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (音声)
- 時系列アクティブ探索法に基づく運転行動の類似検索 (パターン認識・メディア理解)
- A-17-22 実環境大規模運転データベースの構築と閲覧システムの開発(A-17.ITS,一般セッション)
- 自動車運転行動のマルチモーダル信号コーパス(マルチモーダル)
- A-17-5 運転データ同期収録車両の開発と実走行環境における計測(A-17. ITS,一般セッション)
- マイクロコンピュータを用いた単発音入力インタフェースの開発(セッション1 : 理解るインタフェース : 音インタフェース)
- 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)
- E-055 VADが音声認識性能に与える影響(E分野:自然言語・音声・音楽)
- 理解状態のグラフ探索に基づいた音声対話戦略
- 重要文抽出に基づく講義音声の自動要約
- 確率的手法を用いた車線変更軌跡のモデル化
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(2)(雑音・VAD,第9回音声言語シンポジウム)
- 音声対話システムの対話履歴 N-gram を利用したユーザ満足度推定手法
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 自動車内情報システムインタフェース制御のための運転過負荷状態の検出
- 音声対話における発話タイミングの影響
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法(対話,第11回音声言語シンポジウム)
- 音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(Session-1 検出,第8回音声言語シンポジウム)
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化
- 個人性を考慮した車線変更時の車両軌跡生成過程のモデル化(一般セッション,システム・制御のためのパターン認識・メディア理解)
- 誤認識に対処した自然で効率的な音声対話戦略の評価(音声対話・セグメンテーション)
- 誤認識に対処した自然で効率的な音声対話戦略の評価(音声対話・セグメンテーション)
- 講義音声ドキュメントのコンテンツ化と視聴システム(教育システムにおけるプラットホームとコンテンツ開発論文)
- 講義音声自動要約のための重要文手がかり表現の自動抽出(学生セッション II)
- 講義音声自動要約のための重要文手がかり表現の自動抽出(学生セッション II)
- 講義音声認識における収録装置とケプストラム正規化法の検討(第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における収録装置とケプストラム正規化法の検討
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- 時系列アクティブ探索法に基づく運転行動の類似検索(テーマセッション,クロスモーダル)
- 交差点進入時の運転行動の推定(テーマセッション,クロスモーダル)
- A-17-5 信号なし交差点における運転行動予測モデル(A-17. ITS,一般セッション)
- BS-11-4 分散センサ群による運転行動の記録・分析・コンテンツ化(BS-11.ひとを測るセンサネットワーク,シンポジウムセッション)
- ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
- 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
- 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
- 雑談音声の常時認識による楽曲提案システム(一般セッション,福祉と見守りのための画像・音声処理)
- マイクロコンピュータを用いた単発音入力インタフェースの開発(セッション1 : 理解るインタフェース : 音インタフェース)
- ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
- ベイジアンネットワークを用いた単一チャネル信号による背景音楽抑圧(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声認識におけるロバストネス(自動音声認識研究の動向と展望)
- 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)
- 音声認識システムの満足度評価におけるユーザモデル(言語モデル・システム,第10回音声言語シンポジウム)
- 3L-4 多様な利用環境における楽曲検索音声対話システムのフィールドテストと評価(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討(音響・音韻モデル)
- ベイジアンネットワークを用いたバイナリマスキングに基づく音源分離(耐雑音性)
- 車線変更軌跡の確率的予測モデル
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化(信号処理,知的マルチメディアシステム,及び一般)
- ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識(セッション4 : 理解るインタフェース : 手+足+触覚)
- RJ-003 無線加速度センサを用いた頭部運動の計測(ヒューマンコミュニケーション&インタラクション,査読付き論文)
- 動作を伴う発話の収集とその認識(音声基盤技術・インタフェース)
- 動作を伴う発話の収集とその認識(音声基盤技術・インタフェース)
- A-17-7 車載ドライプレコーダで収録された左右加速度に基づく急ハンドル操作の推定(A-17. ITS,一般セッション)
- 音声対話システムの発話系列N-gramを利用した課題未達成対話の検出(研究速報)
- A-19-10 連続指文字認識における手話者の違いに関する検討(A-19.福祉情報工学,一般講演)
- 過去の走行データに基づく運転診断・教示システムの構築(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- 過去の走行データに基づく運転診断・教示システムの構築(MR/ARの実用化に向けたCV/PR技術の課題と展望)
- ICA仮想音源の空間分布を用いた室内音場の解析
- MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 観測信号間のコヒーレンスに基づくICA音源分離の計算量の削減
- 音声対話における韻律変化をもたらす要因分析(リズムとタイミング)
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
- 複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価(音声,聴覚)
- 雑音下音声認識評価基盤 CENSREC
- 反射音の到来方向分布を用いた音源距離推定
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析(ITS画像処理,映像メディア,視覚及び一般)
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析(ITS画像処理,映像メディア,視覚及び一般)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果(音声処理,時系列パターン認識)
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識(音声処理,時系列パターン認識)
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識(音声処理,時系列パターン認識)
- 複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価
- 雑音下音声認識評価基盤CENSREC
- 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果
- ブラインド音源分離の信頼度を用いたマルチバンド音声認識
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析
- 車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析
- ばね質量系を利用した合唱における歌声のF0ダイナミクスのモデル化
- ばね質量系を利用した合唱における歌声のF0ダイナミクスのモデル化
- 楽曲間の類似判定における許容度の推定
- 楽曲間の類似判定における許容度の推定