部分距離空間上の索引付けに基づく音声中の高速検索語検出手法(音声、聴覚,<特集>学生論文)
スポンサーリンク
概要
- 論文の詳細を見る
我々は,部分距離空間上の索引付けに基づく音声中の検索語検出(Spoken Term Detection;STD)のための新しい手法を提案した.提案手法は,検索語音素列と検索対象音素列の間の音素間距離行列を作り,音素間距離を画素濃度とみなすことにより,STDを画像中の直線検出タスクとして捉える.提案手法の大きな特長は,索引に含まれる距離情報に基づきもっともらしい候補から順番に検索結果を高速に出力することである.そのため,従来手法のように検索の際に,必ずしもしきい値を設定する必要はない.我々は,講演音声を対象とした予備実験を行い,高速な検索語検出が可能であることが確認できた.更に我々は,高速化のため,検索アルゴリズムを改良し,また,処理効率を落とすことなく複数音声認識候補を捉えるように拡張することを試みた.講義音声を対象とした実験により,拡張した提案手法でより高速な検索が可能であり,わずかに再現率が向上するという結果が得られた.
- 2012-03-01
著者
関連論文
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- コンピュータとの対話におけるユーザの振舞いの解析
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 音声中の検索語検出のためのテストコレクション構築 : 中間報告
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Web検索質問の自動分類と質問応答への応用(セッション1:テキストマイニング)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- WOZシステムで収録した自由発話音声の対話データベース
- 休止を単位とした漸進的対話処理
- 音声ドキュメント検索の現状と課題
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (音声)
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (言語理解とコミュニケーション)
- 音声ドキュメント検索テストコレクションの試作と基本検索性能評価
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 質問応答における常識的な解の選択と期待効用に基づく回答群の決定(質問応答)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- N-gramの部分的強調による定型表現への言語モデル適応手法(音声,聴覚)
- 自然言語の構文解析のためのLR解析表の圧縮法
- 講演音声の認識における言語モデルのタスク適応
- 音声入力型情報検索のための自由発話収録
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完: 音声ワイルドカード補完機能の実現
- LR表を利用した構造的確率言語モデル - 自然発話コーパスによる評価 -
- 音声シフト:音高を利用した音声入力インタフェースの提案
- プラン認識による発話認識結果の選択
- E-007 Non-factoid型質問応答システムにおける質問タイプ判別法の改善(自然言語・音声・音楽,一般論文)
- E-017 統計翻訳を用いた言語横断質問応答における翻訳モデルの改善(自然言語・音声・音楽,一般論文)
- 認識候補から正解テキストへの翻訳に基づく講演音声ドキュメントのアドホック検索
- 自然言語処理におけるベイジアンネット(ベイジアンネット)
- 部分N-gram頻度情報を利用した質問応答定型表現への言語モデル適応
- 音声入力型テキスト検索システムのための音声認識
- 音声入力型文書検索システムの開発とテストコレクションの構築
- LR表縮退法の提案と自然言語処理および音声認識への応用
- 正準 LR 表を用いた文脈自由文法の perplexity 計算法の提案と評価
- 音声認識の視点から見たLR構文解析法 : 文法知識と統計知識の統合とperplexity計算への応用
- 音声認識における精度と効率の制御を可能とする確率的ビームサーチ法
- 人手による認識用言語モデル構築についての考察
- スクリプト言語を用いたマルチモーダル対話記述の試み(マルチモーダルIF (1),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- スクリプト言語を用いたマルチモーダル対話記述の試み
- マルチモーダル対話記述言語MILES
- 日本語対話処理研究に必要なもの
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- マルチモーダル対話記述用スクリプトとその処理系
- 休止を単位とした発話の文法
- 休止を区切りとした対話処理
- 休止を処理の区切りとした自由発話理解
- 音声対話データの分析と発話理解への応用
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 増進的曖昧性解消モデルに基づいた日本語解析
- 一般化弁別ネットワークを用いた日本語解析
- 増進的曖昧性解消モデルに基づいた統合的日本語解析
- 認識候補から正解テキストへの翻訳モデルに基づく講演音声ドキュメントのアドホック検索
- 固有表現抽出を用いた認識誤りに頑健な音声ドキュメント質問応答
- 翻訳モデルを用いた講演音声ドキュメントの内容検索--文脈情報の利用と言語モデリング検索手法の適用
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- クラウド時代の新しい音声研究パラダイム
- 部分距離空間上の索引付けに基づく音声中の高速検索語検出手法(音声、聴覚,学生論文)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音節継続時間を利用した直線検出に基づく音声検索語検出
- 音声検索語検出を前処理に用いた未知語や認識誤りに頑健な音声ドキュメント検索
- 音声ドキュメント処理ワーキンググループ活動報告
- 音声ドキュメント検索 : マルチメディアデータを対象とした音声言語情報検索(『検索』のゆくえ)
- 音声ドキュメント処理ワーキンググループ活動報告
- フレーズベース統計的機械翻訳との統合に基づく言語横断質問応答(自然言語処理,学生論文)
- 音声言語処理を利用した情報検索評価タスク: NTCIR SpokenDocからSpokenQuery&Docへ