韻律情報を用いた相槌の挿入 (<特集>ヒューマンインタフェースとインタラクション)

概要

論文の詳細を見る
機械とユーザの対話において, 機械が人間と同様に相槌を打つことが可能であれば, ユーザの話しやすさの改善につながる. 本研究では, 話し手の発話間にポーズの出現とほぼ同時に相槌が打たれる場合を対象として, システムによる相槌挿入を試みた. システムが適切なタイミングで相槌を打つにはポーズを検出するよりも早く相槌の挿入判定を行う必要がある. そこで本稿では話し手の発話から抽出した韻律情報を用いて, 予測的に相槌の挿入判定を行う手法について検討した. まず対象としたテレフォンショッピングをタスクとした対話について音声を分析し, 聞き手の相槌が韻律的に特徴のある話し手の発話箇所で打たれていることを示した. 次に相槌音声を消去した対話を聞かせ, 相槌の箇所を人間が判定する実験を行ったところ, 実際に出現した相槌の76%は実験でも検出され, 発話長が長い場合に相槌を打つと判定した被験者が多いことが明らかになった. さらに相槌を打つタイミングについて, 対話の分析と知覚実験を行った. この結果, 相槌は発話中のポーズ開始から0.3秒以内に打つ必要があることが明らかになった. そこでテンプレートを用いた韻律パターンの認識による相槌タイミングの検出方法を提案し, 相槌判定のための予測時間を変えて相槌挿入判定とタイミングの検出実験を行ったところ, 予測時間0.1秒のとき84%, 予測時間0.4秒のとき72%のタイミング正解率を得た. また予測時間0.1秒のとき得られたシステムの応答を人間が評価したところ, 抽出箇所の74%は自然な発声箇所であると判定された.
一般社団法人情報処理学会の論文
1999-02-15

韻律情報を用いた相槌の挿入 (<特集>ヒューマンインタフェースとインタラクション)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク