視覚情報を話題の対象とする音声対話システム
スポンサーリンク
概要
- 論文の詳細を見る
ユーザとの音声対話により実世界中でオブジェクトを探索するロボットの実現を目指す。音声認識や画像認識においては認識誤り、言語情報と視覚情報の対応づけには個人差によるあいまい性が生じる。また、ユーザの信念の誤りによって誤解が生じる可能性もある。そこで本研究では、信念ネットワーク及びユーザモデルを導入し、これらの確率的枠組みに基づいてユーザとの対話をプランニングすることで上記の問題の解決を図る。ユーザの視野外におけるオブジェクト探索タスクで実装を行った結果、ユーザの意図したオブジェクトを同定するまでに必要な対話回数を削減でき、また画像認識結果から音声認識結果を絞り込めることを示した。
- 一般社団法人情報処理学会の論文
- 2001-12-20
著者
関連論文
- 3.料理を作る(生活に役立つメディア処理-料理行動を科学する-)
- 指向性スピーカと波面合成法を用いた近接三次元音場再生システムの性能比較評価
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 映像投影型多面体スピーカアレイによる立体音像への映像付与の一検討(音響信号処理,一般)
- 異なる放射指向性を持つスピーカによる臨場感に関する聴覚実験
- 音声対話による大規模知識ベース検索システム : 音声版ダイアログナビ(音・音声インタフェース)
- 指向性スピーカと波面合成法を用いた近接三次元音場再生システムの音源探査による実環境評価
- 波面合成法を用いた近接三次元音場再生のシステム試作
- 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用
- フレーズスポッティングと意味解析の密結合による頑健な音声言語理解
- 音声理解システムにおける制約緩和法の検討
- 会議音声の自動話題分割による単語辞書と言語モデルの適応(要約・分割)
- 指向性スピーカと波面合成法を用いた近接三次元音場再生システムの性能比較評価(音響信号処理/聴覚/一般)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- マルチチャネル球形スピーカアレイのための独奏音合成手法の検討
- 頑健な音声認識のためのウエーブレットパラメータの最適化に基づく残響抑圧
- ポッドキャストを対象とした音リアクションイベント検出
- 食材に視覚的特徴変化を生じさせる加工における食材と加工動作の同時認識(画像・映像処理)
- 視覚障害者向け調理支援システムの検討(生活メディア(2):料理,日常生活におけるメディア技術)
- 料理映像コミュニケーション基盤ソフトウェアIwaCamを用いた遠隔共同料理実験(生活メディア(2):料理,日常生活におけるメディア技術)
- 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- 文書検索型音声対話システムにおけるベイズリスクに基づく対話制御の最適化(セッション3 : 理解るインタフェース : 音声対話)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(Session-7 システム,第8回音声言語シンポジウム)
- ドメインとスタイルを考慮した Web テキストの選択による対話システム用言語モデルの構築
- 限定されたドメインにおける質問応答機能を備えた文書検索・提示型対話システム(検索・対話)
- 音声会話コンテンツにおける聴衆の反応に基づいたホットスポットの抽出
- ロボット聴覚のための情報統合の現状と課題
- SpeakBySinging : 歌声を話声に変換する話声合成システム
- 点予測による形態素解析
- 調理者の手の動きを時空間制約とした調理中の食材追跡(料理メディア研究会特別セッション)
- Smart Kitchen Project--調理者の調理を妨げない支援のための調理行動認識に向けて
- 調理コンテンツの自動作成のためのレシピテキストと調理観測映像の対応付け(画像・映像処理)
- D-12-136 食材追跡のためのボウルの位置及び傾き推定(D-12.パターン認識・メディア理解,一般講演)
- D-12-135 調理状況認識を目的とした食材追跡の仮説の生成(D-12.パターン認識・メディア理解,一般講演)
- 連続音声認識コンソーシアムの活動報告及び最終版ソフトウェアの概要(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 隣接文節間の係り受け情報に着目した話し言葉のチャンキングの評価
- ロボットとの音声対話のための信念ネットワークを用いた適応的言語理解 (テーマ:一般)
- 視覚情報を話題の対象とする音声対話システム
- 視覚情報を話題の対象とする音声対話システム
- 視覚情報を話題の対象とする音声対話システム
- 音声対話システムにおける訂正発話の韻律的特徴の分析 (テーマ 一般)
- 2000-SLP-31-11 種々のタスクにおける大語彙連続音声認識システムの性能評価と診断
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- VoiceXMLの動的生成に基づく自然言語音声対話システム
- 映像投影型多面体スピーカアレイによる立体音像への映像付与の一検討
- 面振動板の複数点を異なる波形で振動させることによる放射音の指向性制御 : 振動板形状と加振点位置が指向性に及ぼす影響
- 球形スピーカによる異なる放射特性を持つ音響表現の実現(音場制御/一般)
- 波面合成法を用いた近接三次元音場再生の理論的研究(音場制御/一般)
- 少数のスピーカと波面合成法を用いた三次元音場再生システムの提案及び性能評価(音場制御/一般)
- 波面合成法におけるトランスデューサの指向特性--立体音場再生による超臨場感コミュニケーションの実現のために
- 物体表面から放射された音波の近距離場における性質分析と再生法の検討(スペシャルセッション : 究極の超臨場感 (2))
- 球形スピーカーアレイ音響装置による超臨場感音響に関する考察(スペシャルセッション : 究極の超臨場感 (2))
- 異なる放射特性を持つ球形スピーカの実装
- 講義の自動アーカイブ化のための韻律情報を用いた講義音声の文境界の抽出
- 日本語モーラリズム習得支援システム : 調音法に基づいたリズムパターンテンプレートの設定
- スピーカアレイより複数の類似音を同時に放射させたときの音像の知覚
- 聴覚情報評価のための多チャンネル音響システムの提案と実装(セッション2-A : コミュニケーション・グループ通信・協調作業支援(2))
- 聴覚情報評価のための多チャンネル音響システムの提案と実装(セッション2-A : コミュニケーション・グループ通信・協調作業支援(2))
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出
- 柔軟な言語モデルとマッチングを用いた音声によるレストラン検索システム
- ミッシングフィーチャ理論に基づく音声認識を用いた複数話者同時発話認識
- 近接音源に対する聴覚能力測定と近接音場再生手法の検討(セッション2-A : コミュニケーション・グループ通信・協調作業支援(2))
- 近接音源に対する聴覚能力測定と近接音場再生手法の検討(セッション2-A : コミュニケーション・グループ通信・協調作業支援(2))
- 音声言語を用いた仮想空間との対話による試着システム
- 話題と話者に関するPLSAに基づく言語モデル適応(言語モデル・要約)(第5回音声言語シンポジウム)
- ユーザの性格に応じた調理アドバイス文章の選択(メディアと表現,産学連携論文)
- Web からの情報抽出を用いた音声対話システム
- 複加振方式による指向性音響装置の実現 (超臨場感コミュニケーション特集) -- (立体音響技術)
- 3Dオーディオ・ディスプレイによる超臨場感3次元音響の実現 (超臨場感コミュニケーション特集) -- (立体音響技術)
- 文書検索タスクにおける検索要求明確化のための対話戦略
- 音声対話理解のためのネットワーク上のMessage Passingに基づく部分文解析
- 談話標識の統計的選択に基づいたCSJの講演からの重要文抽出(言語モデル・要約)(第5回音声言語シンポジウム)
- 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 講演音声認識のための言語モデルの教師なし適応
- LPC残差のキュムラントとオンラインEMアルゴリズムに基づいた頑健な発話区間検出(認識・検出)
- 講演音声認識のための言語モデルの教師なし適応
- 対話コンテキストとトピッククラスタリングを用いたドメイン外発話の検出
- テキストと音声を用いた単語と読みの自動獲得
- 複数トピック分類の信頼度に基づくドメイン外発話の検出(システム・信頼度)(第5回音声言語シンポジウム)
- 複数トピック分類の信頼度に基づくドメイン外発話の検出
- right-to-leftパーザを用いた会話音声認識
- マルチチャネル球形スピーカアレーによる楽器放射指向性の再現(電気音響,音響一般)
- 把持の順序と外見の変化モデルを利用した調理作業における食材追跡(画像特徴抽出・追跡,料理を取り巻く情報メディア技術論文)
- 呼称により指示された中間食材を同定するための画像認識モデル及び呼称解釈法の提案(画像認識,料理を取り巻く情報メディア技術論文)
- 調理における切断加工時の荷重特徴を用いた食材認識(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 調理における切断加工時の荷重特徴を用いた食材認識(五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- BICに基づく話者モデル選択の教師なし話者インデキシングにおける評価
- 複合的言語制約に基づくキーフレーズスポッティングによる対話音声理解
- 2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法(システム・信頼度)(第5回音声言語シンポジウム)
- ロボット聴覚の現状と課題
- 予稿の話し言葉変換に基づく言語モデルによる講演音声認識
- 画像・振動音・荷重データを統合的に用いた食材認識(食メディア(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- 画像・振動音・荷重データを統合的に用いた食材認識(食メディア(1),五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般)
- IwaCamを用いたメディア処理による遠隔コミュニケーションの支援 : 同時調理を題材とした映像と音声の役割に関する考察(調理支援,データ工学と食メディア)
- K-027 語学学習番組を教材利用するための会話音声とテキストの対応付け(教育工学(4),K分野:教育工学・福祉工学・マルチメディア応用)