リカレントネットを用いた強化学習による探索行動と多値記憶の創発
スポンサーリンク
概要
- 論文の詳細を見る
著者らは,ニューラルネットを用いた強化学習を行うことでさまざまな機能が合目的的かつ調和的に創発することを提唱してきた.本稿では,記憶を利用した決定論的な探索行動の創発に焦点を当てる.ゴールが見えない3×3のランダム迷路タスクのQ学習において,リカレントネットを導入することでエージェントは過去の経験を考慮したより適切なQ値を表現し,より適切な探索行動を学習することができること,さらに,未知の環境でもある程度有効に働くことを確認した.また,分岐位置がランダムに出現する単純な環境での学習では,最適行動実現に必ずしも必要ではないが,適切なQ値を表現するために多値の分岐位置を記憶するようになることを示した.
- 2012-03-07
著者
関連論文
- 巻頭言
- 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み (ニューロコンピューティング)
- 階層型ニューラルネットにおける中間層での適応的空間再構成と中間層レベルの汎化に基づく知識の継承
- 7-215 大分大学工学部におけるGPA制度の現状と課題((12)教育評価・自己点検・評価システム-IV)
- 隠れニューロンの分離を伴う成長型ニューラルネットワーク
- コミュニケーションの強化学習におけるノイズ付加による連続値信号の離散化
- 強化学習による個性・社会性の発現・分化モデル
- Direct-Vision-Based強化学習による視覚付き実移動ロボットの行動獲得
- 移動物体の捕獲行動学習におけるセンサ動作の比較
- 局所信号を入力としたニューラルネットにおける中間層での適応的空間再構成と汎化
- Actor-Qアーキテクチャに基づく能動認識学習システム
- 力学モデルによる大腿義足の関節粘弾性調整法
- 強化学習によるリーチング動作の獲得
- 連続値入力強化学習におけるGauss-Sigmoidニューラルネットワークの有効性
- ニューラルネットワークを用いたDirect-Vision-Based強化学習-センサからモータまで-
- 1337 力学モデルによるエネルギー蓄積型大腿義足のパラメータ調節
- 1335 トルク推定に基づく筋電義手の動作制御
- エネルギー蓄積型大腿義足の力学的解析と制御
- ニューラルネットワークを用いた人間-筋電義手インタフェース
- 認識の学習に基づく注意と連想記憶の形成
- 環境変動下における四足歩行パターンの生成と遷移
- 人間の動作特性を考慮したバイラテラル・マイクロテレオペレーション
- 強化学習とニューラルネットによる知能創発
- 巻頭言
- Direct-Vision-Based 強化学習に基づく Hand-Eye Coordination の形成
- 利害の衝突回避のための交渉コミュニケーションの学習-リカレントニューラルネットワークを用いたダイナミックコミュニケーションの学習-
- 利害の衝突回避のための交渉コミュニケーションの学習と個性の発現
- マルチエージェント系における個性・社会性の学習的生成
- モデル型TD強化学習による動的環境での行動獲得
- 短期記憶のためのリカレントネット簡易学習則の基本構想
- 時間軸スムージング学習
- 遅延強化信号による視点移動の学習
- 強化学習による能動認識能力の学習
- 時間軸スムージング学習による局所センサ信号の統合と空間情報の抽出
- 相関情報抽出ネットと空間認識能力の教師なし学習
- リカレントネットを用いた強化学習による探索行動と多値記憶の創発
- ニューラルネットを用いた強化学習による行動の学習を通した色恒常性の創発