強化学習によるリーチング動作の獲得
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、視覚センサ信号とマニピュレータの状態をニューラルネットに入力し、関節トルクを出力とし、強化学習によってリーチング動作を獲得させるシステムにおいて、(1)リンク長を可変とした場合、および、(2)外力を付加した場合のシミュレーション結果を示す。そして、前者の中間層ニューロンの表現を観察し、入來らの道具を持たせたサルの実験において、手の到達範囲で発火するニューロンが、道具を使用することによって、道具の到達範囲で発火するようになること、また、手先とともに受容野が移動するニューロンが道具の近くでも発火するようになることと類似した結果が得られることを示す。後者では、強化学習を行うことによって、手先と環境の逆ダイナミクスを獲得できること、さらに、試行ごとにランダムな力をかけて学習させることにより、フィードバック制御に重点をおいた制御を獲得できることを示した。
- 社団法人電子情報通信学会の論文
- 2001-03-16
著者
-
伊藤 宏司
東京工業大学大学院総合理工学研究科・知能システム科学専攻
-
柴田 克成
大分大学工学部電気電子工学科
-
杉坂 政典
大分大学工学部
-
伊藤 宏司
東京工業大学大学院総合理工学研究科
-
伊藤 宏司
東京工業大学
関連論文
- 巻頭言
- 表面筋電位を用いた前腕義手の複合動作識別
- 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み (ニューロコンピューティング)
- MRI対応指運動用マニピュランダムの開発
- 体性感覚情報は左右指協調運動に影響を与える(バイオサイバネティックス,ニューロコンピューティング)
- 機能的電気刺激(FES)による感覚情報の事象関連非同期(ERD)への影響(脳活動の計測と解析,一般)
- 内視鏡ロボットのためのマスタ・スレーブシステムの開発 : ロボット操作におけるマン・マシンインタフェースの評価および設計・制御
- 動作の立ち上がり時に着目した非定常EMGによる筋電義手制御
- 脳波(EEG)・電気刺激(FES)によるリハビリテーションシステムについての基礎的研究
- 位相振動子と力学モデルの相互作用による歩行パターン生成
- 階層型ニューラルネットにおける中間層での適応的空間再構成と中間層レベルの汎化に基づく知識の継承
- 7-215 大分大学工学部におけるGPA制度の現状と課題((12)教育評価・自己点検・評価システム-IV)
- 隠れニューロンの分離を伴う成長型ニューラルネットワーク
- コミュニケーションの強化学習におけるノイズ付加による連続値信号の離散化
- 強化学習による個性・社会性の発現・分化モデル
- Direct-Vision-Based強化学習による視覚付き実移動ロボットの行動獲得
- 移動物体の捕獲行動学習におけるセンサ動作の比較
- 局所信号を入力としたニューラルネットにおける中間層での適応的空間再構成と汎化
- Actor-Qアーキテクチャに基づく能動認識学習システム
- 力学モデルによる大腿義足の関節粘弾性調整法
- 強化学習によるリーチング動作の獲得
- 連続値入力強化学習におけるGauss-Sigmoidニューラルネットワークの有効性
- ニューラルネットワークを用いたDirect-Vision-Based強化学習-センサからモータまで-
- 1337 力学モデルによるエネルギー蓄積型大腿義足のパラメータ調節
- 1335 トルク推定に基づく筋電義手の動作制御
- エネルギー蓄積型大腿義足の力学的解析と制御
- ニューラルネットワークを用いた人間-筋電義手インタフェース
- 認識の学習に基づく注意と連想記憶の形成
- 環境変動下における四足歩行パターンの生成と遷移
- 人間の動作特性を考慮したバイラテラル・マイクロテレオペレーション
- 強化学習とニューラルネットによる知能創発
- 粘性力場における上肢動作の運動学習とダイナミクスに依存した汎化
- マスタ・スレーブ内視鏡手術ロボットにおけるカフィードバックのための制御システムの開発
- 左右指運動中の腕姿勢に依存した運動の協調性
- 力場環境適応課題による左右協調運動制御系の解析
- 超音波モータを用いたMRI対応マニピュランダムの開発
- 拘束環境に対する上肢インピーダンス適応メカニズムに関する研究(「脳・認知科学」及び一般)
- 状態予測機構を用いた強化学習による運動学習モデル
- 階層構造を利用した強化学習によるダイナミックマニピュレーション
- 強化学習法を用いた生体運動制御モデル
- 表面筋電位を用いた前腕義手の複合動作識別
- 複数の動的環境に対する人間の運動学習
- 巻頭言
- 力場環境下における最適制御を用いた腕インピーダンスの調節機構
- Direct-Vision-Based 強化学習に基づく Hand-Eye Coordination の形成
- 利害の衝突回避のための交渉コミュニケーションの学習-リカレントニューラルネットワークを用いたダイナミックコミュニケーションの学習-
- 利害の衝突回避のための交渉コミュニケーションの学習と個性の発現
- マルチエージェント系における個性・社会性の学習的生成
- モデル型TD強化学習による動的環境での行動獲得
- 短期記憶のためのリカレントネット簡易学習則の基本構想
- 時間軸スムージング学習
- 遅延強化信号による視点移動の学習
- 強化学習による能動認識能力の学習
- 時間軸スムージング学習による局所センサ信号の統合と空間情報の抽出
- 相関情報抽出ネットと空間認識能力の教師なし学習
- 進化的 recruitment 戦略を用いた強化学習による自律移動ロボットの制御器設計
- 筋疲労を考慮したFES制御法に関する研究
- 繰り返し動作によるタスク指向関節インピーダンスの獲得
- 運動インピーダンスを考慮した冗長アームの作業技能学習
- ユネルギー消費量による四足歩行パターン遷移の発振器-力学モデル
- 皮質 : 基底核ループでの運動系列学習モデル
- パルスニューロンを用いた行動パターンの生成
- 皮質-基底核ループの運動系列学習モデル
- 皮質-基底核ループの機能モデルによる運動系列パターンの生成
- システム論の過去・現在・未来
- 未知の柔軟対象物に対する接触作業のためのマニピュレータのゲインスケジューリング制御
- 未知な柔軟曲線上での倣い作業におけるマニピュレータの動的位置/力制御
- 対象物把持のための手の形状生成モデル
- 対象物把持のための手の形状生成モデル
- 状態パターンの変化にもとづく行動生成モデル
- センサ情報の変化量を利用した移動ロボットによる環境のモデル化と識別(基礎理論)
- 運動想起フィードバック訓練による事象関連脱同期(ERD)出現の検証
- 力場環境下における内部モデルの不完全性とインピーダンス制御による補完
- 機能的電気刺激(FES)による脚運動野における事象関連脱同期(ERD)への影響
- 環境変化の予測情報を利用するモジュール切換型行動生成モデル(バイオサイバネティックス,ニューロコンピューティング)
- 複数環境下における内部モデルの時空間的分離
- バイオメカトロニクスと認知・行動機能(複合医工学)
- バイオメカトロニクスと認知・行動機能
- 複数環境下における内部モデルの分離学習
- 環境の分節化と予測に基づく内部モデルの獲得
- 構造不安定素子を用いた連想記憶モデル
- 2-112 GA の解探索過程における多様性の維持に関する研究
- 遺伝的アルゴリズムによるニューラルネットワーク構造の最適化
- 遺伝的アルゴリズムにおける遺伝子型の多様性維持に関する検討
- 第2回人工生命とロボットに関する国際シンポジウム
- 拍動ポンプのPI制御
- 埋め込み法を用いた半縮退共分散を持つガウス信号の検波
- 最適レギュレ-タの初期値解
- 直流分を用いた動脈の血管抵抗・コンダクタンスの同定
- 移動認識ビ-クルの開発
- ニュ-ラルネットワ-クを用いた文字の学習方法
- 3次バタ-ワ-ス過程のチャンドラセカ-ルスム-ザ
- ファジィ制御におけるメンバ-シップ関数について
- 2次遅れシステムの1段先予測制御
- 状態空間モデルを用いた連続チャンドラセカ-ル形フィルタの設計
- 状態空間モデルを用いた適応ディジタルチャンドラセカ-ルフィルタ
- 共分散情報による線形Predictorの設計
- リカレントネットを用いた強化学習による探索行動と多値記憶の創発
- 未知入力オブザ-バを用いたフィ-ドバック制御系のロバスト設計 (オブザ-バ・状態推定と産業応用)
- ニューラルネットを用いた強化学習による行動の学習を通した色恒常性の創発