視覚に基づく強化学習によるロボットの行動獲得
スポンサーリンク
概要
- 論文の詳細を見る
We propose a method which acquires a purposive behavior for a mobile robot to shoot a ball into the goal by using the Q-learning, one of the reinforcement learning methods. A mobile robot (an agent) does not need to know any parameters of the 3-D environment or its kinematics/dynamics. Information about the changes of the environment is only the image captured from a single TV camera mounted on the robot. Image positions of the ball and the goal are used as a state variable which shows the effect of an action taken by the robot during the learning process. After the learning process, the robot tries to carry a ball near the goal and to shoot it. Computer simulation is used not only to check the validity of the method but also to save the learning time on the real robot. The real robot succeeded in shooting a ball into the goal using the learned policy transferred to it.
- 社団法人 日本ロボット学会の論文
- 1995-01-15
著者
関連論文
- 柔軟関節を持つ直交型ロボット機構の軌道制御
- 1993年コンピュータビジョンとパターン認識会議参加報告
- 発見的バイオロボティクスアプローチと適応的2足歩行
- 生物規範実験ロボティクスのススメ
- マクロ-マイクロシステムによるフレキシブルアームの動的軌道制御
- 複数センサデータの不変性に基づく身体の発見
- 動特性を利用した空気圧拮抗駆動二足歩行(「ダイナミクスを規範とした歩行と制御」)
- 2A1-N-042 コミュニケーション相手の動作情報を利用した共同注意の自律的獲得(認知ロボティクス1,生活を支援するロボメカ技術のメガインテグレーション)
- 1P2-N-104 多層構造の柔軟指を用いた触行動による物体識別(触覚と力覚3,生活を支援するロボメカ技術のメガインテグレーション)
- 1A1-S-043 拮抗型空気圧人工筋を持つ3次元2足ロボットの試作と歩行の実現(2足歩行ロボット1,生活を支援するロボメカ技術のメガインテグレーション)
- 内部に触覚受容器を持つ人間型柔軟指
- 非限定環境に適応する二足歩行ロボット (特集 移動知:能動的な移動機能がもたらす創発的知能)
- 視覚注視と自己評価型学習の機能に基づくブートストラップ学習を通した共同注意の創発
- 注視対象に対する馴化を利用した共同注意の自律的獲得(人間機械協調2)
- 上体を持つ2足歩行ロボットの三次元歩行の動的安定化(2足歩行ロボット2)
- 形態が学習にもたらすもの, 学習が形態にもたらすもの
- エピポーラ幾何を利用した呈示者視野復元に基づく模倣の実現
- ロボットと養育者の相互作用に基づく発達的学習モデルによる共同注意の獲得
- 共同注意発現のためのブートストラップ
- [招待論文]共同注意発現のためのブートストラップ(PRMU&NCテーマセッション(2) : 模倣学習)(認識と学習,模倣学習)
- 2P1-3F-C1 視覚フィードバックと自己評価による共同注意の段階的獲得
- 2P1-1F-F4 ヒューマノイドロボットの動的起き上がり運動の理解と実現
- 研究活動とロボットコンテスト (RoboCup)
- 0718 空気圧人工筋による筋骨格系を有するヒューマノイドの運動生成(OS41:人間とヒューマノイドの関連を考える)
- 2A1-1F-G4 視覚情報に基づいたヒューマノイドのリズム歩行パラメータの学習
- 実ロボットによる行動学習のための状態空間の漸次的構成
- ステレオスケッチ:ステレオ視覚を持つ移動ロボットの行動獲得
- 運動スケッチ:画像運動情報に基づく単眼視覚移動ロボットの行動獲得
- アフィン運動記述を利用した明度相関による視覚追跡
- 画像運動情報に基づく単眼視覚移動ロボットの行動獲得
- 弱一様乱反射仮定による一般化円筒(SHGC)の形状および姿勢の決定
- 弱一様乱反射仮定による筒状物体の形状および姿勢の決定
- 照明条件および反射係数未知の場合の筒状物体の形状復元
- 単一カラー画像から得られる3次元情報を利用したシーンの解釈
- [招待論文]共同注意発現のためのブートストラップ(PRMU&NCテーマセッション(2) : 模倣学習)(認識と学習,模倣学習)
- 2A1-1F-E6 学習者の動特性を考慮した見まねによる動作獲得
- 1P1-3F-B6 複数の触覚を持つ柔軟指の製作
- 1P1-1F-E3 組み替え可能なモジュール部品を使用した二足歩行ロボットの開発
- 受動歩行からヒューマノイドロボット歩行に向けて(3部 モデル解析)
- 複数の学習するロボットの存在する環境における協調行動獲得のための状態空間の構成
- バリスティック歩行によるロボットの二足歩行の実現
- 脚式ロボットにおける創発された歩行からの行動レパートリの獲得
- 視覚サーボと内力の制御の統合に基づく多指ハンドによる操り
- 「ダイナミクスを規範とした歩行」は二足歩行の新しいパラダイムとなるか(「ダイナミクスを規範とした歩行と制御」)
- マクロ-マイクロシステムによるフレキシブルアームの準静的軌道制御
- 行動獲得過程における視覚情報の自律的構造化 : 分節と統合
- サンプル再利用型強化学習による準受動2足歩行ロボットの学習
- 複雑な物体間における空間的位置関係の言語記述方法(ファジィ画像情報処理)
- 反射の組み合わせによる歩行の実現
- 2A1-E8 上半身を持つ受動歩行ロボット(38. 2足ロボット)
- マルチエージェント環境における行動学習のための部分空間同定法による状態空間の構成
- マルチエージェント環境における部分空間同定法を用いたエージェントの判別と行動理解 : 分散協調視覚システムにおける対象の行動理解法
- 競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得
- エピポーラ拘束に基づく他者視野の復元による模倣
- 発見的バイオロボティクスアプローチと適応的2足歩行
- クラスタリングから得られる領域の記述に基づく動的な輪郭抽出
- F11(3) 空気圧人工筋による適応的二足歩行(【F11】身体・脳・環境の相互作用による適応的ロコモーション機能の発現機構に関するフォーラム)
- ロボット工学の基礎, 本多庸悟著, 出版社 昭晃堂, 発行 2003年2月, 全ページ 142頁, 価格 2,700円, ISBN 4-7856-9069-0
- 新しいAI研究を目指して
- 視覚に基づく行動獲得 : 強化学習によるサッカーロボットのシューティング行動の獲得
- 環境との相互作用を通して獲得される適応的マニピュレーション
- エッジの対応にもとづくステレオカメラのセルフキャリブレーション
- 異種視覚センサ情報処理の中間結果の融合による画像理解
- 動き情報に基づくエッジセグメントの最適分割
- 2A2-C22 社会的インタラクションを実装可能なシミュレータープラットフォーム : SIGVerse:社会的知能発生シミュレータ
- 2A1-D18 二関節筋を含めた筋骨格構造を持つ二脚ロボットの三次元走行の実現
- 2A1-A22 二関節筋を含む筋骨格構造を持つ一脚ロボットによる跳躍運動の解析
- 1A2-L08 人型筋骨格系を有するロボットアームの二関節筋を利用したリーチング動作
- 未知環境内で動作するロボットのビジュアルサーボ/力サーボハイブリッド制御系
- ロボットの行動学習 (ロボットの知能化)
- マルチセンサ情報を動的に統合することによる道路シーンの解釈とモデリング
- 10.画像処理・コンピュータビジョン(テレビジョン年報)
- 10.画像処理・コンピュータビジョン(テレビジョン年報)
- 1P1-E16 教示者の音韻情報と唇の形状を利用したロボットの音韻獲得
- 2A1-G10 筋骨格系ロボットアームによる皮膚感覚と筋感覚を利用した運動発見
- 2A1-F20 柔軟な脊椎構造を有する筋骨格系赤ちゃんロボットの開発
- 2A1-F09 筋骨格系赤ちゃんロボットの股関節外旋を利用した歩行創発
- 2A1-F08 人型筋骨格系を有するロボットアームの階層的制御
- 1A2-L09 柔軟なロボットハンドを用いた揉み動作による物体識別
- ズーム機構を利用した視覚サーボ系の構成
- 移動ロボットの最適な案内地図の自動生成( 統合化生産システム)
- 1A2-L09 ダイナミックタッチに基づく物体カテゴリの形成(認知ロボティクス)
- 2A2-D19 空気圧人工筋骨格系全身型二足ロボットによる立位姿勢の安定化
- 2A1-A06 ヒトのプロポーションを模倣した二脚ロボットの連続跳躍の実現
- 1A1-F15 筋骨格系赤ちゃんロボットの運動発達における脊椎姿勢の影響
- 2A2-D20 肩甲骨を有する人間型筋骨格系ロボットアームの開発
- 1A1-F09 多様な受容器をもつ柔軟なロボットハンドによる滑らない把持の学習
- 1A1-C20 リカレントニューラルネットワークを用いたロボットハンドによる動的センシング
- ビジュアルサーボによる脚式ロボットの揺動の実現
- ロボットの行動獲得のための状態空間の自律的構成
- 三次元再構成を行わない視覚サーボ系のための障害物回避軌道の生成
- 2台のカメラを用いたマニピュレータの平面障害物回避軌道の生成
- 構造やパラメータに関する先験的な知識を必要としないフイードフォワード補償器を持つ適応型ビジュアルサーボ系の構成
- ロボットの行動獲得のための状態空間の自律的構成
- 視覚に基づく強化学習によるロボットの行動獲得
- マクロ・マイクロシステムによるフレキシブル・マニピュレータの制御
- 平面2自由度フレキシブルアームの軌道制御
- 仮想的な剛体リンクと受動関節を用いたフレキシブルア-ムのモデリング
- タイトル無し
- センサ情報の統合と理解のよる移動ロボットのための世界モデルの構築