対話音声中の言い直し発話の検出と認識

スポンサーリンク

概要

論文の詳細を見る
コンピュータと人間が音声を通じてコミュニケーションを図る場合,誤認識は避けられない.ここで,誤認識の訂正のために,ユーザが誤認識された部分を言い直した場合に,それが言い直しの音声であるとシステムが判定できれば,誤認識からの回復が容易になると考えられる.本稿では,自然な対話音声中に含まれる繰り返し部分の存在を検出することにより言い直し発話を検出することを試みる.システムとの対話を収集した際に実際に生じた誤認識時の言い直し発話について,DPマッチングの最適パスの線形性判定とDP距離の閾値処理を用いた方法と,音声認識を行った結果得られるN-best候補中に含まれる認識単語の重なり度を用いた方法とを組み合わせることで,閾値などの設定に用いないオープンタスクにおいて再現率91.9%,適合率87.7%の検出性能を得た.さらに,この検出結果を音声認識の際の語彙・文法の制約に用いることによって対話音声の認識性能を向上させることができた.
一般社団法人情報処理学会の論文
2003-05-26

著者

関連論文

もっと見る

スポンサーリンク