11912 改良型罰回避政策形成アルゴリズムへの罰基底度閾値決定機構の導入と評価(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
スポンサーリンク
概要
- 論文の詳細を見る
Penalty Avoiding Rational Policy Making algorithm (PARP) based on Profit Sharing method and was planed to learn a penalty avoiding policy. PARP is improved to save memories and to cope with uncertainties. The efficiency of the Improved Penalty Avoiding Rational Policy Making algorithm is influenced by threshold of the penalty basis function γ significantly. Up to now, it is necessary to set appropriate γ through a preliminary experiment. In this paper, we propose a technique for learning γ with the multi start method. The proposal technique is applied to a keepaway task that is a benchmark in a robotic soccer game, to confirm the effectiveness.
- 一般社団法人日本機械学会の論文
- 2010-03-09
著者
-
宮崎 和光
大学評価・学位授与機構
-
小林 博明
Department Of Mechanical Engineering Informatics School Of Science And Technology Meiji University
-
小林 博明
明大
-
小林 諒平
明大
関連論文
- エージェント-環境間相互作用 : 強化学習の立場からの再考
- 専門科目名のリストを利用した学位授与事業のための科目分類支援システムの評価
- キーワードの関連用語を考慮したシラバス検索システムの構築(Webインテリジェンスとインタラクション)
- シラバス-専門用語の相互クラスタリングを用いたカリキュラム分析システムの改善(高等教育と情報)
- 分類候補数の能動的調整を可能にした学位授与事業のための科目分類支援システムの提案と評価(高等教育と情報)
- キーワードの関連用語を考慮したシラバス検索システムの改善(情報教育と授業支援システム/一般)
- 電子化されたシラバスに基づく学位授与事業のための科目分類支援システムの試作(組織活動を支える情報システム)(情報システム論文)
- シラバスの文書クラスタリングに基づくカリキュラム分析システムの構築(教育)
- N-029 シラバスデータベースの構築と利用(N.教育・人文科学)
- N-004 科目分類支援システムの改善とその応用(N.教育・人文科学)
- 罰回避政策形成アルゴリズムの改良とオセロゲームへの応用
- 罰を回避する合理的政策の学習
- 罰を回避する合理的政策の学習
- 罰回避政策の形成とゲーム問題への応用
- ITを利用した高等教育の展開--教室外講義,通信教育を中心に
- 冗長腱を持つ腱駆動ロボット機構の剛性調節
- 非線形バネ要素を持つ7自由度腱制御アームの機構と制御
- Profit Sharingを用いたマルチエージェントと強化学習における報酬配分の理論的考察
- 101 強化学習によるロボットの知的制御 : Lego Mindstorms への実装
- 強化学習システムの設計指針
- Profit Sharing に基づく強化学習の理論と応用 (計算学習理論の進展と応用可能性)
- 腱駆動ロボットの作業に適した関節剛性のGAによる学習
- 腱駆動ロボットの知的制御 : 位置・力ハイブリッドANN制御
- 腱駆動機構における小形非線形バネ弾性要素の開発
- 1A1-H09 腱駆動ハンド機構による把持安定性解析と把持物体に関する剛性可調整範囲
- 1A1-H4 GAによる腱駆動ロボットの最適調節剛性の獲得(50. ワイヤ駆動系の機構と制御)
- 1A1-H2 非線形弾性要素を持つ腱駆動ハンド機構での把持物体に関する剛性調整と制御(50. ワイヤ駆動系の機構と制御)
- 非線形弾性腱を持つ腱駆動ロボット機構の定力制御
- 102 ANN による腱駆動ロボットの制御 : 関節剛性の学習
- RBFネットワークを用いた腱駆動ロボットの制御
- 腱に非線形弾性をもつ腱駆動システムの制御
- 腱駆動ロボット機構の腱破断に対する安全度と制御
- ロボットシステムの動的開発環境に関する研究
- 空気圧駆動アクチュエータを用いた腱制御駆動ロボットに関する研究
- 空気圧アクチュエータを用いた腱制御駆動ロボットに関する研究
- 非線形バネ要素を持つ腱制御手首機構の研究
- 腱制御手首機構の機構特性と制御に関する研究
- ランダム サンプリング ロボット システムの安定性
- 大学評価と学位授与(アイ・サイ問答教室)
- 分散制御系の準最適制御
- 電子化シラバスに基づく学位授与のための科目分類支援システムの検討
- 合理的政策形成アルゴリズムの連続値入力への拡張
- 期待報酬推定型 Profit Sharing におけるロバスト性解析 : 無効ルール抑制条件における理論的考察と局所解問題への展開
- 2P1-B13 腱駆動式2足歩行ロボットに関する研究 : 機構と最適関節剛性の学習
- 分散制御系の可制御性
- 分散制御系の極指定可能性と可制御性
- Profit Sharing の不完全知覚環境下への拡張 : PS-r^*の提案と評価
- 11911 腱駆動2足歩行ロボットの開発と腰軌道および腱張力の強化学習(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
- 11912 改良型罰回避政策形成アルゴリズムへの罰基底度閾値決定機構の導入と評価(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
- 11910 レーザ距離計を用いた自律移動ロボットの障害物地図と軌道生成に関する研究(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
- より人間らしい人工知能を目指して(編集委員2007年の抱負)
- より人間らしい人工知能を目指して
- MindStormsと高等教育 : 特集総説(MindStormsと高等教育)