Amazon Mechanical Turkを用いた音声データ収集による音声検索システムの評価
スポンサーリンク
概要
- 論文の詳細を見る
Amazon Mechanical Turk (MTurk) を用いて効率的に音声データを収集する方法について述べる。音声検索の評価用セットのための音声データを収集するタスク (HIT)、及び収集されたデータの品質を検証するタスクを設計した。1000 以上の発話をきわめて効率的に収集することができた。そのうち 90% 以上は正しい書き起こしがある有用なデータであり、妥当な音声認識精度が得られた。このデータを用いて、音声により書籍を検索するシステムの評価を行った。その結果、意味スロット毎に用意したベクトル空間モデルを組み合わせる提案手法が、従来の単純なベクトル空間モデルに比べて、高い検索性能を実現することを確認した。
- 2011-07-14
著者
-
Rudnicky Alexander
Computer Science Department Carnegie Mellon University Usa
-
李 清宰
Academic Center For Computing And Media Studies Kyoto University Japan.
-
河原 達也
Academic Center For Computing And Media Studies Kyoto University Japan.
関連論文
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ドメイン内の信頼度と談話の整合性を用いた音声認識誤りの検出(認識, 信頼度)
- Amazon Mechanical Turkを用いた音声データ収集による音声検索システムの評価