強化学習によるマニピュレータの制御
スポンサーリンク
概要
- 論文の詳細を見る
強化学習は事前情報や知識を用いずに、制御の評価だけを用いて、試行錯誤によって制御を自立的に獲得していく学習法である。従って、幅広い制御問題に適用できる可能性が高い。これまでに、倒立振り子の制御、迷路問題、バッグギャモンなどに適用されてきている。そこで、ロボットの制御などの実際問題に適用していく第一段階として、2自由度のマニピュレータに強化学習を適用したので報告する。
- 社団法人電子情報通信学会の論文
- 1995-03-27
著者
-
塩野 悟
三菱電機(株)先端技術総合研究所
-
山田 訓
三菱電機
-
塩野 悟
三菱電機(株)電力・産業システム事業所産業・環境エンジニアリングセンター
-
山田 訓
三菱電機中央研究所
-
塩野 悟
三菱電機中央研究所
-
渡邊 彰
三菱電機先端技術総合研究所
-
渡邊 彰
三菱電機中央研究所
関連論文
- 高齢者の心身活性化を目的とした遊びリテーションシステムの開発とグループレクリエーションへの適用可能性の検討
- 心身の活性化を目的とした遊びリテーションシステム(第三報)
- 心身の活性化を目的とした遊びリテーションシステム(第二報)
- 5)サル大脳皮質MT野の知見に基づく動き統合(ヒューマンインフォメーション研究会)
- サル大脳皮質MST野の知見に基づく動き検出モデル
- サル大脳皮質MT野の知見に基づく動き統合モデル
- サル大脳皮質MT野の知見に基づく動き統合モデル
- 4)相対運動検出のためのMST野ニューロンモデル
- 相対運動検出のためのMST野ニューロンモデル : 視聴覚技術
- 相対運動検出のためのMST野ニューロンモデル
- 2波長脳計測光学システムによる味覚野神経活動の画像計測
- ラット味覚野の光学計測
- 回分式間欠曝気活性汚泥プロセスにおける高率窒素除去のための運転支援システム
- ディジタル・アナログ協調型強化学習
- アメフラシ神経回路網の光学多点同時計測と学習メカニズムの解析(<生物物理特集>神経回路網の生物物理)
- 高効率・高濃度オゾン発生器の開発
- 極短ギャップオゾン発生器の開発--パルプ漂白を目指した高濃度オゾン発生 (平成8年度〔紙パルプ技術協会〕年次大会(富山・能町)特集-2-) -- (一般講演)
- アメフラシ神経節細胞のパタ-ン刺激に対する応答
- 強化学習によるマニピュレータの制御
- アメフラシ中枢神経系メカニズムの研究
- アメフラシ神経系の作動原理を解き明かす - ブレインコンピュータの実現を目指して -
- アメフラシの学習と倒立振り子の制御 (小特集:バイオ素子に向けた生物研究)
- 強化学習による2足歩行ロボット制御の学習
- 高齢者の心身活性化を目的とした遊びリテーションシステムの開発とグループレクリエーションへの適用可能性の検討(バーチャルリアリティと心理学)
- 極短ギャップオゾン発生器の開発 : パルプ漂白を目指した高濃度オゾン発生