対話音声中の言い直し発話の検出と認識
スポンサーリンク
概要
- 論文の詳細を見る
コンピュータと人間が音声を通じてコミュニケーションを図る場合,誤認識は避けられない.ここで,誤認識の訂正のために,ユーザが誤認識された部分を言い直した場合に,それが言い直しの音声であるとシステムが判定できれば,誤認識からの回復が容易になると考えられる.本稿では,自然な対話音声中に含まれる繰り返し部分の存在を検出することにより言い直し発話を検出することを試みる.システムとの対話を収集した際に実際に生じた誤認識時の言い直し発話について,DPマッチングの最適パスの線形性判定とDP距離の閾値処理を用いた方法と,音声認識を行った結果得られるN-best候補中に含まれる認識単語の重なり度を用いた方法とを組み合わせることで,閾値などの設定に用いないオープンタスクにおいて再現率91.9%,適合率87.7%の検出性能を得た.さらに,この検出結果を音声認識の際の語彙・文法の制約に用いることによって対話音声の認識性能を向上させることができた.
- 一般社団法人情報処理学会の論文
- 2003-05-26
著者
関連論文
- 長時間分析に基づく位相情報を用いた音声認識の検討 (音声)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 1987年音響・音声・信号処理国際会議(ICASSP 87)
- 文字コードに依存しない情報検索の実現
- 中間言語を用いたインドネシア語-日本語対訳辞書の拡充
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法
- ニュース番組における字幕生成のための文内短縮による要約
- 3W-5 ニュース音声の認識結果を用いた要約による字幕生成
- 連続出力分布型HMMによる日本語音韻認識