講演音声ドキュメント検索のための擬似適合性フィードバック
スポンサーリンク
概要
- 論文の詳細を見る
講演や講義などの長い音声ドキュメントの検索のための擬似適合性フィードバック(PRF:Pseudo Relevance Feedback)について述べる.PRFとは,与えられたクエリ(初期クエリ)で検索を行い,その検索結果から初期クエリに関連する語を抽出して,新たなクエリを作成するクエリ拡張手法である.本論文では,はじめに講演音声そのものを対象とした検索(講演検索)および講演の一部を検索対象とした検索(講演パッセージ検索)においてPRFの効果を調査し,長い音声ドキュメントの検索では,関連語抽出が難しくPRFが効果的でないことを示す.次に,この問題を解決するために,講演音声をあらかじめ適当な長さの連続する発話群(パッセージ)に機械的に区切っておき,それを対象として初期検索を行って関連語抽出を行うPRF手法を提案する.提案手法が長い音声ドキュメント検索において従来法よりも適していることを明らかにしたうえで,拡張したクエリによる検索結果と初期クエリによる検索結果を組み合わせることの効果を示す.CSJの講演音声を対象とした講演検索および比較的長めの講演パッセージ検索において,平均的な検索精度(11点平均精度)の向上,および検索精度が向上するクエリ数の増加が確認できた.
- 2014-05-15
著者
関連論文
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- 日本語講演音声ドキュメント検索における索引付けの検討
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 英文読解効率テストの有効性の検証(言語の学習・教育)
- 5U-3 音響防犯システムのためのSVMを用いた叫び声の検出と音声認識(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-3 多言語音声の同時認識のための統計的翻訳モデル(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 雑音下音声受音におけるWeighted反復スペクトル減算法を用いたミュージカルノイズの低減(音声,聴覚,学生論文)
- K-051 英文読解能力測定モデルへの熟語難易度の導入(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-052 英語学習支援のための聴解コーパスの有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識
- K-053 英文読解速度テストに用いたテキストの難易度を考慮したテスト有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
- 講演音声ドキュメント検索のための擬似適合性フィードバック
- 雑音下音声受音における Weighted 反復スペクトル減算法を用いたミュージカルノイズの低減
- 雑音環境下における叫び声検出のための特徴量次元数の削減(学生ポスターセッション,時系列パターン認識,一般)