強化学習による物体識別のための探索行動の獲得
スポンサーリンク
概要
- 論文の詳細を見る
In this study, we propose a reinforcement learning method for discernment behaviors of robot. Discernment behavior, which is a type of exploratory behaviors that support object feature extraction, is a fundamental tool for a robot to orientate itself, operate objects and establish higher classes of knowledge. In this method, a robot learns the discernment behaviors through the interaction with multiple objects. While the interaction, the robot takes reinforcement signal according to the cluster distance of the observed data. We validated the effectiveness of the model in a mobile robot simulation. Three different shaped objects were placed beside the robot one by one. In this learning, the robot learned different behaviors corresponding to each object. Then, we confirmed the kind of feature that is extracted from an object using learned exploratory behaviors.
著者
-
金 天海
早稲田大学理工学術院
-
郷古 学
東北学院大学工学部
-
金 天海
早大
-
金 天海
Hri-jp
-
小林 祐一
静岡大学大学院工学研究科 機械工学専攻
-
郷古 学
東北学院大学工学部 機械知能工学科
-
金 天海
ホンダ・リサーチ・インスティチュート・ジャパン
-
小林 祐一
静岡大学大学院工学研究科
関連論文
- 自己組織化回路素子SONEにおけるノイズの抑制
- ローカルルールに基づいた論理回路の自己組織化アルゴリズム
- 能動的な動きに基づく知覚の恒常性を実現する状態表現(人工知能,データマイニング)
- 観測範囲に制限のあるセンサ同士の統合によるロボットの行動生成法
- 2P2-G11 自己組織化回路素子SONEの制御回路構造形成メカニズム : 移動ロボットの衝突回避学習における制御回路構造の発達(進化・学習とロボティクス)
- 2A1-E03 自己組織化ネットワーク素子群における対ノイズ性能の向上
- 2P1-F19 恒常性を実現する能動知覚と行動学習
- 2P1-C13 位相空間分割による高速枝刈り・軌道計画アルゴリズム
- 車載カメラ画像からの視点変更画像生成に関する検討 (メディア工学 サマーセミナー2013 : 画像処理の理論と実際)
- 強化学習による物体識別のための探索行動の獲得
- 屋外不整地環境における無人車両のための走路判別
- 屋外不整地環境における無人車両のための走路判別 (特集 画像技術の実利用)
- プロジェクタ・カメラシステムを用いたテクスチャマッピングと点滅表示による色情報提示(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- マニピュレータに搭載したレーザレンジファインダを用いた透明容器中の液中物体の3次元形状計測
- 車載カメラ画像からの視点変更画像生成に関する検討(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 距離画像によるヒューマノイドの位置姿勢計測(若葉研究者の集い4,サマーセミナー2013〜画像処理の理論と実際〜)
- 1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
- 1P1-Q03 逆時間方向探索木を用いた準最適安定化制御(【機械力学・計測制御部門】ロボットシステムのダイナミクス&デザイン)
- 1A1-L09 準最適運動計画のための機械モデルに応じた位相空間分割手法(動作計画と制御の新展開)
- State and Action Space Construction Using Vision Information.
- ステレオカメラを用いた視覚障碍者のためのタッチパネル操作支援システム
- 1A1-O09 教示データからの特徴空間の構成にもとづく力覚情報を用いた抱え上げ行動の生成(進化・学習とロボティクス)
- 1A1-O07 局所線形埋め込みを用いたロボット動作のための視覚特徴空間の生成(進化・学習とロボティクス)
- 群口ボットによる協調捕獲行動の自律分散制御
- Hyper-cubic Function Approximation for Reinforcement Learning Based on Autonomous-Decentralized Algorithm
- Function Approximation for Reinforcement Learning Using Autonomous-Decentralized Algorithm.