連続な状態・行動空間の自律的分割機構を持つ強化学習法
スポンサーリンク
概要
- 論文の詳細を見る
- 2002-09-15
著者
関連論文
- (2)携帯電話端末を利用した学習用インターフェースのデザインと評価(携帯端末のためのインタフェース)
- 進化型人工神経回路網の構造進化のための一手法 : 二重倒立振子問題への適用
- 冗長個体表現を用いた進化戦略による工学的実関数最適化
- ネットワーク型囚人のジレンマにおける協調行動の創発に関する研究
- 強化学習による自律型アームロボットの協調行動獲得
- 2A1-3F-B8 情報量基準による強化学習エージェントの入出力モデルの評価
- 連続な状態・行動空間の自律的分割機構を持つ強化学習法
- 1A1-E02 自律型アームロボットの強化学習制御
- 強化学習に基づく協調型アームロボットの制御 : 学習過程の解析
- ベイズ識別法を用いた強化学習 : 学習過程の解析
- 2P1-L5 ベイズ識別関数に基づく強化学習のための状態空間の分割法(27. 強化学習とロボティクス・メカトロニクス)
- 2A1-30-035 教師なしクラスタリング手法を用いた状態空間の自律的構成
- 問題の可聴化表現における音の属性と解きやすさの関係(セッション4: インタフェース一般(1), 高齢者/子どものためのインタフェースおよび一般)
- Neutral Networks を含む適応度景観における遺伝的アルゴリズムの進化ダイナミクス
- マルチエージェントシミュレーションのためのユーザ情報に基づく意思決定モデル(進化・学習とロボティクス3)
- Multi-parent Recombination を用いる進化戦略
- e-Learningにおける学習コンテンツのカスタマイズ支援--協調フィルタリングによる類似ユーザの検出 (テーマ:「インタラクティブシステムとエージェント技術」および一般)
- インタラクションヒストリの要約と閲覧に関する一考察
- 進化学習を用いた多脚歩行ロボットによる歩容獲得に関する研究
- 自律四足ロボットを用いた歩容獲得に関する研究
- オンラインコミュニティにおける発展過程の可視化 (テーマ:「Web情報処理」および一般発表)
- オンラインコミュニティにおける発展過程の可視化(時系列情報処理,特集「Web情報処理」及び一般)
- 2A1-S-068 ウェブ・アクセスログに基づくインターネットユーザの興味遷移パターンの抽出(進化・学習とロボティクス4,生活を支援するロボメカ技術のメガインテグレーション)
- 複数アームロボットによる荷上げ協調行動の獲得
- Instance-Based Classifier Generator による自律移動ロボットの行動獲得
- 《第3回》共創的意思決定とシステムインテグレーション
- 均質な自律ロボット群による協調行動獲得問題 : 機能分化に基づくアプローチ
- 「マルチエージェントシミュレーションの社会システムへの応用特集号」を企画して