部分観測環境のモデルパラメータに対する徒弟学習(強化学習,統計推理,データベース,一般)
スポンサーリンク
概要
- 論文の詳細を見る
エキスパートの演示を観測することでタスクを学習する徒弟学習において、環境が部分的にしか観測できず、かつその環境のモデルに不確実性が含まれる問題を考える。このような問題設定は、人間との対話システムなど、対象の明示的なモデリングが困難なアプリケーションの設計に有効である。我々は、エキスパートが対象環境の真のモデルをもとに最適な行動を選択していると仮定することで、演示の背後にある行動決定過程に対する推論を通して対象環境のモデルに関する情報を抽出できることを示す。環境の応答のみに注目して環境モデルを推論する従来手法と比較して、提案する2種のアルゴリズムは、非常に短い演示からでも環境モデルのパラメータを推定できることを示す。
- 2012-03-05
著者
-
竹内 誉羽
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
牧野 貴樹
東京大学生産技術研究所
-
牧野 貴樹
東京大学生産技術研究所:FIRST合原最先端数理モデルプロジェクト
-
竹内 誉羽
株式会社ホンダ・リサーチ・インスティチュート・ジャパン
関連論文
- 3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
- インタラクション機能を有するプレゼンテーション記述言語の開発(インタフェース,入出力,その他)
- 医療観察法における指定入院医療機関スタッフの意識調査--開棟前の期待や危惧にもとづいた開棟後アンケート調査より (日本精神科看護学会 第15回 専門学会(2)看護研究論文)
- インタラクション機能を有するプレゼンテーション記述言語の開発(HAIにおけるコミュニケーションとインタラクション適応)
- 他者理解をシミュレーションする(シミュレーションの世界)
- ノンパラメトリックベイズに基づく統計的機械学習(特別セッション,機械学習とその応用)
- LG_002 タスク指向対話とチャットを統合した対話ロボットインターフェース(G分野:音声・音楽)
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
- A-16-16 ヒューマノイドロボットとアニメキャラクタによる共同プレゼンテーションMPML-HR Ver.2.0(A-16.マルチメディア・仮想環境基礎,一般講演)
- LTAG文法からの変換によるHPSG英文法の作成
- マルチモーダルプレゼンテーション記述言語MPMLのヒューマノイドへの拡張とその心理学的評価(ロボットとコミュニケーション及び一般)
- ICML 2009 会議報告
- 第1回「鈴木裕樹研究基金」助成研究 指定通院医療機関における触法精神障害者の治療・ケアの現状と課題--多職種チームスタッフの抱える困難感に焦点をあてて
- 情と意をもつ脳型コンピュータ (特集 知・情・意の神経学)
- 強化学習(私のブックマーク)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK (言語理解とコミュニケーション)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK (音声)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK(オーガナイズドセッション:音声対話,第13回音声言語シンポジウム)
- 短文を投稿するための音声対話システム
- 短文を投稿するための音声対話システム
- 音声対話システムにおいて複数の言語理解モデルの利用を容易にするツールキット : MLUTK
- 部分観測環境のモデルパラメータに対する徒弟学習(強化学習,統計推理,データベース,一般)
- 強化学習における部分観測問題のモデル設計に関する新しい最適解探索手法
- 特定物体認識とマルコフ確率場によるモノクロ画像の自動彩色法(第15回情報論的学習理論ワークショップ)
- エントロピー最小化によるRestricted Boltzmann Machineの学習の正則化(第15回情報論的学習理論ワークショップ)
- β変換器の量子化誤差に関する理論的解析
- β変換器の量子化誤差に関する理論的解析
- ロボットに対する移動指示の状況依存逐次理解