認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
スポンサーリンク
概要
- 論文の詳細を見る
実環境での音声対話システムの使用において,誤認識を回避することは難しい.誤認識が起きると,システムはユーザの期待する応答とかけ離れた応答を行い,対話がスムーズに進まなくなることも多い.そこで本研究では,音声認識器が誤認識した場合でも,認識信頼度と対話履歴を用いることで正しくユーザの意図を推定することができる音声言語理解手法を提案する.これは,音声認識器が誤認識した場合でも多くの場合,複数候補(N-best)中に正解が含まれていること,システムが誤認識した場合にはユーザは大体訂正反応を示すこと,タスク指向対話には強い一貫性がありユーザは基本的に意味的・文脈的に関係した内容以外を発話しないことを利用する.また,提案手法ではあらかじめすべての認識可能単語を理解候補として保持し,言語理解部の対話戦略において音声認識結果中の単語との意味的関連性などを考慮している.これにより音声認識結果のN-best中に正解の一部が含まれていない場合でも,複数のユーザ発話の認識結果に基づくことで正しい意図を推定することが可能となっている.評価データにおいて,提案手法における対話単位での理解率は72.2%(21,430/29,670対話),単語単位での理解率は87.1%(77,544/89,010単語)であり,従来手法の最新認識結果の上位候補を優先するシステムの57.9% (17,178/29,670対話),75.4%(67,084/89,010単語)と比較しても有効である.
- 社団法人電子情報通信学会の論文
- 2006-07-01
著者
-
伊東 幸宏
静岡大学創造科学技術大学院
-
小西 達裕
静岡大学情報学部
-
伊藤 敏彦
北海道大学大学院情報科学研究科
-
甲斐 充彦
静岡大学工学部
-
伊東 幸宏
静岡大学情報学部
-
藤原 敬記
北海道大学情報科学研究科
-
荒木 健治
北海道大学情報科学研究科
-
荒木 健治
北海道大学大学院情報科学研究科
-
伊藤 敏彦
豊橋技術科学大学情報工学系
-
甲斐 充彦
静岡大学
-
伊藤 敏彦
北海道大学
-
藤原 敬記
北海道大学大学院情報科学研究科
-
荒木 健治
北海道大学大学院工学研究科
関連論文
- グループコミュニケーションの活性化を目的とするRFIDを用いたスケジュール遂行支援システムの開発(グループコミュニケーション,HCGシンポジウム)
- 複数家電の連携操作が可能な家電音声入力インタフェースの構築(システム)
- 文脈への意味の位置付けを用いた対話システムとその評価(言語,テキストの知能情報処理)
- 繰り返し構造を考慮したWebページの見出しの階層構造の解析(セッション2,学生チャレンジ特集)
- 繰り返し構造を考慮したWebページの見出しの階層構造の解析(テーマ:学生チャレンジ特集)
- 表構造における意味的関係に基づくWWW検索性能の向上(Web検索・Webアーカイブ,データ工学論文)
- メニュー操作を考慮した機種非依存の家電統合インタフェース(音声基盤技術・インタフェース)
- 対話文脈を利用した構文意味解析
- 検索キーワード間の修飾-被修飾関係の詳細な分析に基づくWWW検索性能の向上(自然言語)
- Webサイトの適応型サイトマップの作成とそのオンラインショッピング支援への応用(セッション4:ビジュアライゼーションとユーザエクスペリエンスの向上,学生チャレンジ特集)
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 抽象的データ構造を含むアルゴリズム表現に基づくプログラム評価支援システムの構築
- ユーザモデルと状況を反映させた車載機への広告情報配信システムの構築 : 興味度推定と配信ルールの自動学習(セッション8:データマネージメント)
- E_009 モジュラリティの高い対話制御開発環境の試作(E分野:自然言語)
- 認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
- 表構造における意味的関係に基づくWWW検索精度の向上(セッション2)
- 多義性解消におけるアライメントスコアの重みの推定について(検索・多義性解消)
- 意味の対応付けと依存関係の解釈を考慮した対話意味表現(対話(2))(第6回音声言語シンポジウム)
- 情報家電の操作のための対話インタフェースの開発(対話(1))(第6回音声言語シンポジウム)
- 依存関係の解釈と概念情報の統合処理(ポスターセッション)(第6回音声言語シンポジウム)
- 文脈情報を利用した構文的曖昧性の解消(ポスターセッション)(第6回音声言語シンポジウム)
- 抽象的データ構造を用いたアルゴリズム表現に基づくプログラム評価システムの実用性評価 (学習の身体性とマルチモーダルインタフェース(音声言語インタフェース含む))
- プログラミング教育における教師支援のためのプログラム評価機構(次世代教育(学習)支援システム論文特集)
- 史料の管理・検索・可視化機能を持つ歴史学研究支援統合環境の構築 (人文科学とコンピュータ)
- 情報系学長,おおいに語る
- 対象世界モデルを利用したプログラム理解の枠組
- 対象世界モデルを利用したプログラム理解とその応用
- 対象世界モデル上でのシミュレーションに基づくプログラム理解とコメント生成について
- 対象世界モデル上でのシミュレーションに基づくプログラム理解とコメント生成について
- アセンブラプログラムの理解とコメント文の生成
- 複数家電用音声インタフェースのユーザビリティの向上
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- 複数家電用音声インタフェースのユーザビリティの向上
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- ミラー効果に基づく相互チュートリアルによる複数インタフェースでの操作方法学習支援
- 繰り返し構造の検出に基づく Web ページの見出しの階層構造の解析
- メニュー操作を考慮した機種非依存の家電統合インタフェース(音声基盤技術・インタフェース)
- Webサイトの適応型サイトマップの作成とそのオンラインショッピング支援への応用(セッション4:ビジュアライゼーションとユーザエクスペリエンスの向上,学生チャレンジ特集)
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 意味の対応付けと依存関係の解釈を考慮した対話意味表現(対話(2))(第6回音声言語シンポジウム)
- 情報家電の操作のための対話インタフェースの開発(対話(1))(第6回音声言語シンポジウム)
- 意味の対応付けと依存関係の解釈を考慮した対話意味表現(対話(2))(第6回音声言語シンポジウム)
- 情報家電の操作のための対話インタフェースの開発(対話(1))(第6回音声言語シンポジウム)
- 依存関係の解釈と概念情報の統合処理(ポスターセッション)(第6回音声言語シンポジウム)
- 依存関係の解釈と概念情報の統合処理(ポスターセッション)(第6回音声言語シンポジウム)
- 文脈情報を利用した構文的曖昧性の解消(ポスターセッション)(第6回音声言語シンポジウム)
- 文脈情報を利用した構文的曖昧性の解消(ポスターセッション)(第6回音声言語シンポジウム)
- 連体修飾・連用修飾成分間の依存構造を利用した意味の重ね合わせ手法(音声とコミュニケーション及び一般)
- 平成14年度情報学部研究プロジェクト報告 : 対話訓練システムのための言語処理・文脈処理に関する研究
- テキスト史料の抜粋・分類機能と分類結果の俯瞰機能による歴史学研究支援 (人文科学とコンピュータ)
- ユーザモデルと状況を反映させた車載機への広告情報配信システムの構築 : 興味度推定と配信ルールの自動学習(セッション8:データマネージメント)
- ユーザモデルと状況を反映させた車載機への広告情報配信システムの構築--興味度推定と配信ルールの自動学習
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 頑健な意味理解のための音声認識信頼度と対話履歴を利用した発話意図推定手法
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(ポスターセッション)(第5回音声言語シンポジウム)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(ポスターセッション)(第5回音声言語シンポジウム)
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(第5回音声言語シンポジウム : ポスターセッション)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(第5回音声言語シンポジウム : ポスターセッション)
- 車載情報機器との音声言語インタフェースにおける文体統一の効果(第5回音声言語シンポジウム : ポスターセッション)
- 状況と文脈を利用した音声対話型車載インタフェースの構築と評価(第5回音声言語シンポジウム : ポスターセッション)
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
- 数学文章題の問題世界における事物の統合・分割の関係の分類
- 車載端末向け情報選別配信システムにおける到着地推定機構(ITS)(次世代移動体通信システム)
- 車載端末に対する到着地推定を用いた情報選別配信システム(情報選択・配信)
- 問題領域モデル上でのプログラムの動作説明と可視化を行う学習支援システムの構築とその評価--大小関係世界を対象としたシステムとその評価 (テーマ:「e-Learningとインタラクティブ技術--音声言語処理・対話技術の教育への応用と展開」および一般)
- テキスト史料の抜粋・分類・俯瞰を支援する歴史学研究支援システム
- テキスト史料の抜粋・分類・俯瞰を支援する歴史学研究支援システム
- 感性語句を含む自然言語文による画像検索のための形状特徴空間の構築
- コンピュータで「ええじゃないか」--ええじゃないかデータベースと歴史学研究支援システムの構築 (特集 最新実例データベース)
- 特集「学習支援の新たな潮流-学習科学と工学の相互作用-」にあたって
- 文構造における検索キーワード間の修飾 : 被修飾関係に基づくWWW検索精度の向上(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- 見出しの階層関係を利用したWWW検索精度の改善(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般)
- ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて(構文,係り受け解析)
- ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて(構文, 係り受け解析)(言語理解とコミュニケーション)
- 自然言語による画像データベース検索
- 自然言語による画像データベース検索
- ペアワイズアライメントを用いた動詞の多義性解消
- 第16回静岡大学技術報告会開催に寄せて
- A-15-32 複数種類の端末が利用できる情報システムにおける, 適応型インタフェース(A-15. ヒューマン情報処理, 基礎・境界)
- ドライブプラン作成・編集のためのPC版サブシステムDPS-PCの構成と評価(ナビゲーション)(ユビキタス環境のモバイル通信システムとITS)
- 自然言語インタフェースを持つドライブプランニングシステムの構築
- 自然言語インタフェースを持つドライブプランニングシステムの構築
- ドライブプランニングシステムにおける対話インタフェースの構築
- ドライブプランニングシステムの自然言語インタフェース(音声言語インタフェースの実用化と音声言語対話への展開)
- 高校化学のICAIにおける対象世界モデルの表現と対話への利用
- 高校化学の知的CAIにおける入力文解釈機構について
- 問題演習型知的CAIにおける入力文解釈と対話制御
- イメージ情報を利用した機械動作説明文の理解
- 文脈への意味の位置づけを重視した対話意味表現 (テーマ:一般)
- 目的地設定タスクにおける対話状況の違いによる言語・音響的特徴の比較(音声言語情報処理とその応用)
- 同時処理タスクの難易度の変化における言語能力への影響
- 同時処理タスクの難易度の変化における言語能力への影響
- 目的地設定タスクにおける対話状況の違いによる言語的特徴の分析
- 二次元図形情報を利用した機械動作説明文の理解
- 関係データベースの自然言語インタフェース
- イメージ的対象世界モデルを利用した自然語文の理解にいて : 2次元図形イメージを利用した機械機構の動作説明文の理解を題材として