音声検索語検出を前処理に用いた未知語や認識誤りに頑健な音声ドキュメント検索
スポンサーリンク
概要
- 論文の詳細を見る
音声ドキュメント処理において,未知語や音声認識誤りへの対処は不可欠である.本研究では,音声ドキュメント検索に対し,未知語・認識誤りへの対策が比較的検討されている音声検索語検出の手法を前処理として取り入れる手法を提案する.提案手法はまず,連続音節認識結果に対し,クエリを構成する単語を検索語とした音声検索語検出を行い,各語の出現情報を取得し,次にこの出現情報を用いて各文書とクエリとの関連度を計算し,文書検索を行う.提案手法の有効性を調べるために,講演音声を対象とした音声ドキュメント検索テストコレクションを用いて,大語彙連続音声認識結果に対してそのままテキストベースの検索手法を適用する従来法との比較実験を行った.提案法は,クエリに未知語が含まれる場合でも,検索性能を落とすことなく頑健に検索できることが分かった.特に,音声ドキュメントの単語正解率が60%程度と低い場合では,未知語を含むクエリの性能を有意に改善した.さらに,従来法と提案法を相補的に統合することにより,検索性能がより改善されることが分かった.
- 2013-02-15
著者
関連論文
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 音声ドキュメント検索の現状と課題
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (音声)
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (言語理解とコミュニケーション)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- E-007 Non-factoid型質問応答システムにおける質問タイプ判別法の改善(自然言語・音声・音楽,一般論文)
- E-017 統計翻訳を用いた言語横断質問応答における翻訳モデルの改善(自然言語・音声・音楽,一般論文)
- 認識候補から正解テキストへの翻訳に基づく講演音声ドキュメントのアドホック検索
- 翻訳モデルを用いた講演音声ドキュメントの内容検索--文脈情報の利用と言語モデリング検索手法の適用
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- クラウド時代の新しい音声研究パラダイム
- 部分距離空間上の索引付けに基づく音声中の高速検索語検出手法(音声、聴覚,学生論文)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音節継続時間を利用した直線検出に基づく音声検索語検出
- 音声検索語検出を前処理に用いた未知語や認識誤りに頑健な音声ドキュメント検索
- 音声ドキュメント検索 : マルチメディアデータを対象とした音声言語情報検索(『検索』のゆくえ)
- フレーズベース統計的機械翻訳との統合に基づく言語横断質問応答(自然言語処理,学生論文)
- 音声言語処理を利用した情報検索評価タスク: NTCIR SpokenDocからSpokenQuery&Docへ