制限付きボルツマンマシンとエコーステートネットワークによる部分観測マルコフ決定問題の解法(一般講演,機械学習によるバイオデータマインニング,一般)

スポンサーリンク

概要

論文の詳細を見る
部分観測マルコフ決定過程(POMDP)により定式化される環境下において最適な行動選択を実現するためのアプローチには、環境のダイナミクスに関する事前知識を利用するモデルベースなアプローチと、それらを必要としないモデルフリーなアプローチがある。本研究では、エコーステートネットーワーク(ESN)と制限付きボルツマンマシン(RBM)を組み合わせたモデルフリーな手法を提案する。シミュレーター上で行ったロボットナビゲーションタスクの結果、提案手法が、エコーステートネットワークの持つ長期予測能力と制限付きのボルツマンマシンの持つ高次元入力に対するロバスト性を合わせ持つことが示された。また、ESNの隠れ層がタスクに必要となる過去の情報を高次元入力から抽出し保持していること、RBMの隠れ層がタスク依存な情報表現をしていることなどが示された。
2011-06-16

著者

関連論文

もっと見る

スポンサーリンク