音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定
スポンサーリンク
概要
- 論文の詳細を見る
音声入力型の情報検索のためのベイズリスク最小化音声認識の研究を行う.音声入力型情報検索では,ベイズリスク最小化音声認識は検索に影響が大きい単語を重要視し,検索に致命的な音声認識誤りを避けることを目的として行われる.その際,検索への影響が大きい単語にその影響度を反映した重要度を設定することが重要であるものの,そのような重要度の自動決定手法はこれまでに存在しなかった.この問題に対し,本論文では,音声入力型情報検索における音声認識のための単語重要度の自動推定手法を提案する.具体的には,検索要求のテキストとその音声認識結果および検索の正解ラベルの3点を推定のための学習データとし,単語重要度を推定する手法を提案する.重要度推定用のデータについて,人手による準備を必要とする方法(教師あり推定),一部を必要としない方法(半教師あり推定),および必要としない方法(教師なし推定)のそれぞれを提案し,複数の検索システムを用いてそれらの有効性を調べた.教師ありおよび半教師あり推定の結果から提案する推定の枠組みが正しく動作をすることを示した.さらに教師なし推定の結果から,提案手法を用いることで音声入力型情報検索の音声認識にとって有効な重要度を決定できることを示した.
- 2013-07-15
著者
関連論文
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 外国語学習・教育支援を目的とした学習者発話動画の自動字幕付与システムの検討(音声・言語・音響教育,一般)
- 統計的前編集のための対訳コーパスからの学習データの自動生成
- 日本語講演音声ドキュメント検索における索引付けの検討
- 日本語講演音声ドキュメント検索における索引付けの検討
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 最適フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 広域文書類似度と局所文書類似度を用いた講演音声ドキュメント検索
- 5U-4 会議の情報保障における吹き出し型字幕の有用性の調査(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (音声)
- 統計的前編集のための対訳コーパスからの学習データの自動生成 (言語理解とコミュニケーション)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- E-002 高フロアリング係数を用いた反復スペクトルサブトラクションによるミュージカルノイズの低減の検討(E分野:自然言語・音声・音楽,一般論文)
- 4W-5 複数の機械翻訳器による学習データの自動生成とそれに基づく統計的前編集(機械翻訳,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-3 音響防犯システムのためのSVMを用いた叫び声の検出と音声認識(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-3 多言語音声の同時認識のための統計的翻訳モデル(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 機械翻訳のための統計的手法に基づく前編集
- 機械翻訳のための統計的手法に基づく前編集
- 会議の情報保障を目的とした吹き出し型字幕提示方式の検討(システム)
- 音声理解を指向した音声認識のための単語重要度の自動推定(学生セッション II)
- 国際会議・ニュースのアーカイブのための統計的機械翻訳を利用した音声認識の検討
- D-14-8 ベイズリスク最小化音声認識に基づく大学情報検索システムの構築(D-14.音声,一般セッション)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 初等中等教育における授業音声認識のための言語モデルの検討(一般セッション,福祉と音声処理,一般)
- 音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定
- 雑音下音声受音におけるWeighted反復スペクトル減算法を用いたミュージカルノイズの低減(音声,聴覚,学生論文)
- K-051 英文読解能力測定モデルへの熟語難易度の導入(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- K-052 英語学習支援のための聴解コーパスの有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識
- K-053 英文読解速度テストに用いたテキストの難易度を考慮したテスト有効性の検証(教育工学(3),K分野:教育工学・福祉工学・マルチメディア応用)
- オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価(音声,聴覚,システム開発論文)
- 雑音環境下における叫び声検出のための特徴量次元数の削減(学生ポスターセッション,時系列パターン認識,一般)