確率的なゆらぎを有する強化学習を用いた大車輪ロボットの行動獲得と報酬の関係について
スポンサーリンク
概要
- 論文の詳細を見る
We have succeeded in acquiring forward actions to various robot systems using Reinforcement Learning. We have also succeeded in acquiring a giant swing motion as dynamic task by devising its rewards. Although the giant swing robot has a continuous dynamic motion such as its angle and angler velocity, its state of the motion must be divided into discrete states in order to apply the reinforcement learning. Moreover, this giant swing robot system is not under Markov decision process by both control and defective sensation problem. For these reason, this robot shows probabilistic behavior. Then, this paper attempts to clarify the effect of probabilistic behavior of giant swing on the view point of various rewards, whose results are visualized using rotation rate. The results also show that features of the effect of probabilistic behavior are different for each reward.
著者
関連論文
- 複数可操作度総合評価によるマルチフィンガ・アームロボットのアドミッタンス制御(機械力学,計測,自動制御)
- 力センサ無しの条件下で近似ZMP計測法を用いたサーフィンロボットの実現 : 重力方向変化の環境下でのロボットの直立安定性の考察(機械力学,計測,自動制御)
- ミュラー・リヤー錯視による人間上肢運動の変化
- 強化学習によって獲得される芋虫型ロボットの前進行動形態に関する考察(機械力学,計測,自動制御)
- 強化学習を用いたスポーツロボットの大車輪運動の獲得とその行動形態の考察
- 可操作度を考慮したフィンガ・アームロボットの協調的インピーダンス制御(機械力学,計測,自動制御)
- 遠隔力感覚コミュニケーションにおける基礎的なシステム構成法と感覚面からの基本評価(機械力学,計測,自動制御)
- 強化学習による二次元移動ロボットの行動獲得とその学習知識の操作(機械力学,計測,自動制御)
- 冗長ロボットの構造階層化を用いた運動制御
- ハプティックインタフェースを用いた力感覚と錯覚現象の計測
- 1自由度フレキシブルアームの反復学習制御
- ハプティックインタフェースを用いた仮想環境上における対象物の構築法とその操作について(機械力学,計測,自動制御)
- ハプティックインタフェースを利用した仮想環境上の触知覚錯覚
- 高精度速度および加速度近似手法を用いたロボットのアドミッタンス制御における周波数特性の改善
- 報酬変化を用いた強化学習によるロボットの前進行動獲得(機械力学,計測,自動制御)
- 1A1-S-058 報酬変化を用いたQ-Learningによるロボットの行動獲得(進化・学習とロボティクス1,生活を支援するロボメカ技術のメガインテグレーション)
- ニューラルネットワークを用いた1自由度フレキシブルアームの非線形システム同定と学習制御(機械力学,計測,自動制御)
- 可操作度を用いた上肢ロボットの協調制御による自然な運動機能の生成(機械力学,計測,自動制御)
- 視覚認識行動自律型ロボットを用いた高校生向け技術教育プログラムの実践(技術教育・工学教育)
- コンプライアンス制御可能な小型ヒューマノイドロボットを用いたジャンプ動作の実現
- マスタスレーブシステムのコンプライアンス制御 : ダイレクトコンプライアンス制御とワールドコンプライアンス制御の比較(機械力学,計測,自動制御)
- 電流測定による関節トルク推定値を用いたZMP推定法の提案とその応用(機械力学,計測,自動制御)
- 電磁誘導に基づく三軸触覚センサとその特性 : ロボット指のための小型触覚センサの開発(機械力学,計測,自動制御)
- 学習と進化のアルゴリズム的・心理学的側面
- 主観と科学の接点
- ロボットの心 : 主観と客観
- ロボットと『心』
- トルク制御可能なサーボユニットを用いた小型ヒューマノイドロボット(機械力学,計測,自動制御)
- サーボ系の構成がハプティックインタフェースに及ぼす影響(機械力学,計測,自動制御)
- 小型自律ロボットのためのCMOSイメージセンサを用いた小型両眼視覚ワンボードセンサモジュールの開発と適用
- フィンガとマニピュレータの個別アドミッタンス制御におけるタスク実行時のフィンガ可操作度補償効果
- 2A1-E09 ヤモリ型ロボットの作成と学習制御への展開
- 1A2-F26 認識範囲によるミュラー・リヤー錯視の上肢運動に与える影響について
- ハプティックインタフェースを用いた受動型直線描画教示における視覚情報の影響(研究速報)
- 人間技能の抽出・模擬によるフィンガ・アームロボットのヨーヨー操作(目隠しヨーヨーの実現)
- 強化学習を用いた大車輪ロボットの学習知識の選択可能性について
- ハプティックインタフェースを用いた直線教示における教示方法と再現時の視覚情報の影響の考察(ヒューマンコンピュータインタラクション)
- ハプティックデバイスを用いた目隠しラバーハンド錯覚における触刺激の遅延の影響に関する研究(研究速報)
- 主観報酬を用いた強化学習における人間の教示特性に関する考察
- Caterpillar Robot Locomotion Based on Reinforcement Learning Using Subjective Reward
- 可操作度保持型マルチフィンガ・アームロボットの協調的アドミッタンス制御における動的特性
- 内力外力インピーダンスモデルを用いた物体把持手法に関するインピーダンス制御とアドミッタンス制御の比較
- 確率的なゆらぎを有する強化学習を用いた大車輪ロボットの行動獲得と報酬の関係について
- 1P1-C02 ハプティックインタフェースを用いた直線教示に関する研究(ハプティックインタフェース)