音声対話によるソフトウェアサポートタスクのための確認戦略
スポンサーリンク
概要
- 論文の詳細を見る
汎用的な大規模知識ベースを自然言語音声で検索するタスクにおいては,話し言葉特有の冗長性や音声認識誤りに対処する必要がある.本研究では,ユーザ発話の認識結果から検索に有用な部分を同定し,確認を行う手法を提案する.まず、検索に決定的な影響を与える箇所について,認識誤りやドメイン外である可能性が高い場合は検索前に確認を行う.この際には,検索に用いる知識ベースのみから作成した言語モデルで計算した検索整合度を利用する.次に、結果として検索に影響を与える箇所について,音声認識結果のN-best候補を実際に検索した結果の違いに基づいて検索後に確認を行う.以上の対話戦略をソフトウェアサポートを行うダイアログナビのフロントエンドとして実装した.評価の結果,単純に音声認識結果を用いる場合より検索成功率が向上し,また認識の信頼度を用いる確認戦略よりも効率的に確認が行えることを示す.
- 一般社団法人情報処理学会の論文
- 2003-07-18
著者
-
駒谷 和範
京都大学情報学研究科知能情報学専攻
-
奥乃 博
京都大学情報学研究科知能情報学専攻
-
木戸 冬子
ヤフー株式会社
-
木戸 冬子
マイクロソフト株式会社
-
河原 達也
京都大学情報学研究科
-
翠 輝久
京都大学情報学研究科知能情報学専攻
-
翠 輝久
(独)情報通信研究機構
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- 非線形振動子による引き込みを利用した仮想空間における歩行
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析 (第5回生物数学の理論とその応用)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- モデル駆動アーキテクチャに基づくホームネットワークサービスの開発支援(学生セッション A_モデル指向(1))
- 自動抽出した換喩表現を用いた係り受け関係のずれの解消
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- ネットオークションにおける属性検索のための出品情報文書からの属性抽出
- ネットオークションにおける属性検索のための出品情報文書からの属性抽出(用語・情報抽出)
- 係り受けの2部グラフと共起関係を利用した同義表現抽出(抽出(2))
- 話し言葉の整形作業における削除箇所の自動同定(音声言語処理)
- 局所的な係り受けと韻律の素性を用いた話し言葉の節・文境界推定(話し言葉処理)
- 日本語CALLシステムの音声認識における効果的な予測のための決定木に基づく誤りパターンの分類(一般(ポスターセッション),第9回音声言語シンポジウム)
- 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索(Session-2 情報検索, 第7回音声言語シンポジウム)
- 点予測と系列予測の2段階化による品詞推定の精度向上
- 点予測と系列予測の2段階化による品詞推定の精度向上
- スロットベースのベクトル空間モデルの組合せによる音声書籍検索
- ウエーブレットの最適化と雑音プロファイルを用いた雑音抑圧による頑健な音声認識
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 「ユビキタスアプリケーションを支えるツールキット」(全4回) : 第3回 Julius を用いた音声認識インタフェースの作成
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- 異種コーパスの組合せによるトリガー言語モデルの構築(言語モデル)(第6回音声言語シンポジウム)
- Webからの情報抽出を用いた音声対話システム
- 文脈を考慮した確率的モデルによる話し言葉の整形
- 重み付き有限状態トランスデューサーと対数線形モデルを用いた話し言葉の整形
- 国会音声認識システムの音響・言語モデルの半自動更新
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- 点予測による形態素解析
- 文化と言語の維持保存に貢献するためのデジタル博物館の試みトランスクリプションデータを流用する字幕映像生成システムの提案
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 文脈を考慮した確率的モデルによる話し言葉の整形(音声検索・要約,第11回音声言語シンポジウム)
- 会議音声認識におけるBICに基づく高速な話者正規化と話者適応
- ベイズ推論を用いた連続音声からの言語モデル学習
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- スライド情報を用いた言語モデル適応による講義の音声認識と字幕付与(一般セッション「音声言語処理」)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ポッドキャストを対象とした音リアクションイベント検出
- ウイグル語の形態素に基づく言語モデルと音声認識システム
- 3L-3 大規模文書を知識ベースとする音声対話システム(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習(システム,第9回音声言語シンポジウム)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- インターネットオークションにおける不正行為者の発見支援(マイニング,夏のデータベースワークショップDBWS 2006)
- インターネットオークションにおける不正行為者の発見支援(マイニング)
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 講義音声認識に基づくノートテイクシステム(福祉と音声処理,一般)
- 局所的な係り受けの情報を用いた話し言葉の節・文境界の推定
- 多数のセンサを用いたポスター会話の収録とその分析(マルチモーダル)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 視覚情報を話題の対象とする音声対話システム
- 音声版ダイアログナビ : 音声対話によるソフトウェアサポート(音声対話システムB)(テーマ:音声対話システム、音声言語情報処理、一般)
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 音声対話によるソフトウェアサポートタスクのための確認戦略
- 大規模テキスト知識ベースに基づく自動質問応答 : ダイアログナビ
- 自動質問応答システム,ダイアログナビの現状と課題
- 『日本語話し言葉コーパス』における自己修復部(Dタグ)の自動検出および修正に関する検討(合同セッション「対話」)
- 統計的言語モデル変換を用いた音響モデルの準教師つき学習
- HTMLのフォーム入力のための文法の自動生成とSALTによる実装
- 音声認識エンジンJulius/JulianのAPI実装
- VoiceXML の動的生成に基づく協調的な電話自動応答システム
- 統計的言語モデル変換を用いた音響モデルの準教師付き学習
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- 2ZN-1 ポスター会話中の音リアクションイベントに基づくホットスポットの抽出(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- 文強勢と等時性の自動検出に基づく英語韻律学習支援システム
- 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現
- MAHL:演奏者間のインタラクション分析のためのスコアアライメント手法の提案
- ロボットとの音声対話におけるユーザの心的状態の分析
- 家電製品のマニュアルの知識と構造を利用した音声対話ヘルプシステム
- 環境音を対象とした擬音語自動認識 : 擬音語表現における音素決定曖昧性の解消
- バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 講演の書き起こしに対する統計的手法を用いた文体の整形
- 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング