音声対話システムのためのN-gramに基づくキーワードからの文生成(対話,第11回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
質問と応答の対応を文対文で統計的にモデル化する音声対話システムにおいては,学習のために大量の質問文と応答文のペアが必要である.しかし,質問文データを用意するためにユーザの実際の発話を収集・書き起こしするのはコストが高く,人手で可能な質問文のバリエーションを考えて収集するのも経験と労力を要する.本研究では,この統計的応答選択システムのための質問文をキーワードから自動生成する手法を提案する.文に含まれるべきキーワードが複数与えられたとき,それらのキーワード間の区間および両端に出現しうる尤度上位の単語列をN-gram確率に基づいて探索し,区間ごとに得られた単語列を結合・再評価を行い,最終的にデータベースに与える文を選び出す.音声情報案内タスクの音声対話システムにおいて実験した結果,入力に音声認識結果を用いるときに,応答をキーワードと直接対応付ける場合に59.6%の応答正解率であったのが,そのキーワードから生成した文と対応付ける本手法を用いることで65.1%に改善された.さらに,タスク非依存の一般的なN-gramを使用した場合も,同様に性能の改善が見られた.生成する文数や,単語列探索時のビーム幅などの様々なパラメータによる性能の変化についても報告する.
- 2009-12-14
著者
-
徳田 恵一
名古屋工業大学大学院
-
李 晃伸
名古屋工業大学大学院工学研究科創生シミュレーション工学専攻
-
李 晃伸
名古屋工業大学
-
徳田 恵一
名古屋工業大学
-
李晃伸
名古屋工業大学大学院情報工学専攻
-
南角 吉彦
名古屋工業大学大学院 工学研究科
-
李 晃伸
名古屋工業大学大学院工学研究科
-
南角 吉彦
名古屋工業大学大学院工学研究科創成シミュレーション工学専攻
-
吉見 孔孝
名古屋工業大学大学院工学研究科創成シミュレーション工学専攻
-
季 晃伸
京大
-
南角 吉彦
名古屋工業大学
-
南角 吉彦
名古屋工業大学大学院工学研究科
関連論文
- 拡張分離型格子HMMに基づく顔画像認識 (ヒューマン情報処理)
- 拡張分離型格子HMMに基づく顔画像認識 (パターン認識・メディア理解)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 第1回 HTSを用いた音声合成システムの構築
- 状態継続長を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)