GAにより探索空間の動的生成を行うQ学習
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement learning has recently received much attention as a learning method for complicated systems, e.g., robot systems. It does not need prior knowledge and has higher capability of reactive and adaptive behaviors. However increase in dimensionality of the action-state space makes it diffcult to accomplish learning. The applicability of the existing reinforcement learning algorithms are effective for simple tasks with relatively small action-state space. In this paper, we propose a new reinforcement learning algorithm: “Q-learning with Dynamic Structuring of Exploration Space Based on Genetic Algorithm ”. The algorithm is applicable to systems with high dimensional action and interior state spaces, for example a robot with many redundant degrees of freedom. To demonstrate the effectiveness of the proposed algorithm simulations of obstacle avoidance by a 50 links manipulator have been carried out. It is shown that effective behavior can be learned by using the proposed algorithm.
- 社団法人 人工知能学会の論文
- 2001-11-01
著者
関連論文
- 身体と環境の特性を利用した状態-行動空間の抽象化 : 強化学習を用いた自律ヘビ型ロボットへの適用
- サービスロボットへの指令における不完全性の対話による補完手法
- ロボカップレスキュープロジェクト
- 知能ロボットのめざすもの
- 非熟練オペレータ用情報収集ロボット : サーモグラフィを用いた視覚支援システムの開発
- 1P1-S-092 非熟練オペレータ用情報収集ロボット : サーモグラフィを用いた視覚支援システムの開発(レスキューシステム・レスキュー工学2,生活を支援するロボメカ技術のメガインテグレーション)
- 集中的および分布的柔軟性をもった大型宇宙構造物の分布定数制御 -バネ結合した2本の柔軟ビームの場合-
- 1リンク・フレキシブル・アームのロバスト力制御
- あるクラスの3状態2入力の非ホロノミックシステムの制御系設計と小惑星サンプルリターンロボットの姿勢制御
- 2P1-84-132 超冗長蛇型ロボットの運動学モデルに基づいたユニット設計論
- RoboCup-Rescue : 情報科学の緊急災害対応問題への挑戦
- 非対称な剛体負荷を持つ1リンクフレキシブルアームのPDS制御
- 曲げ・ねじり変形を考慮した1リンクフレキシブルアームのダイナミクスベースト力制御
- 分布的および集中的柔軟性をもつ大規模宇宙構造物のPDSS制御
- 強化学習による冗長ロボットの自律制御に関する研究 : 身体像を考慮した強化学習
- 2A1-3F-B4 環境モデルの利用による強化学習の効率化 : 経験の共有による環境モデルの構築
- GA主導型Q学習による冗長ロボットの制御 : 機械学習・データマイニング(「人工知能分野における博士論文」)
- 1A1-56-078 強化学習による超冗長系の制御
- 周波数依存型最適サーボ系によるフレキシブル倒立振子の位置決め制御
- 2214 サービスロボットのための対話モデル
- 知覚量に基づく制御系設計 : 蛇型ロボットの方向の知覚量を用いたフィードバック制御
- 超冗長系の状態空間分割による学習の効率化
- 設計意図と図形を関連づけたCAD(機械要素,潤滑,工作,生産管理など)
- 対象物に添付した知能デバイスからの情報を利用したロボット動作の支援手法(NP5 知能化・IT化技術)
- 操作性を考慮した情報収集ロボット : システムの設計概念とシステム構成の提案(レスキューシステム・レスキュー工学1)
- 3405 設計意図を図形と関連づけた CAD の開発
- GAにより探索空間の動的生成を行うQ学習による実多自由度ロボットの制御 : 階層構造の拡張と蛇型ロボットへの適用
- 2P1-2F-F2 バッティングロボットに関する研究 : トスバッティングの実現
- QDSEGAによる多足ロボットの歩行運動の獲得
- GAにより探索空間の動的生成を行うQ学習
- 先端負荷をもった2リンク柔軟アームのPDS制御
- 4次元地理情報システムに基づくレスキューロボットの開発 : 第5報 : 地理情報とGPS測位値を融合した移動ロボットのナビゲーション
- 剛結合された2本のビームのモデリングとロバスト制御
- 冗長蛇型ロボットの運動学モデルに基づいた制御とユニット設計
- 分布的・集中的柔軟性をもつ大型宇宙構造物の振動系の指数安定化
- 災害時での利用を考慮した時空間地理情報システムにおけるデータ構造に関する考察
- 双腕 1 自由度フレキシブルアームの PDS 協調制御
- フレキシブル・アームの曲げ・ねじり結合振動と力のロバスト制御
- 柔らかさへの挑戦 : フレキシブルアーム開発
- トポロジー構造算出型GISを用いた複数端末協調システムに関する考察
- 曲げ・ねじり変形を考慮したアームに対するカフィードバックの安定性解析とロバスト力制御
- 自動車用レ-ザレ-ダのスポ-ツ計測への応用--短距離走スタ-トダッシュの計測