2A1-E07 CTRNNを用いた連続な状態空間における強化学習法の提案
スポンサーリンク
概要
- 論文の詳細を見る
There are some difficulties to apply traditional reinforcement learning algorithms to robot motion control task. Because most algorithms are concerned with discrete state space and based on the assumption of complete observability of the state. This paper deals with these problems by combining the reinforcement learning algorithm and CTRNN learning algorithm (BPTT). We carried out an experiment on pendulum swing up task without rotational speed information. It is shown that the information about rotational speed of pendulum, which is considered as a hidden state, is estimated and encoded on the activation of a context unit.
- 一般社団法人日本機械学会の論文
著者
-
菅野 重樹
早大理工
-
尾形 哲也
京大
-
谷 淳
理化学研究所 脳科学総合研究センター
-
谷 淳
理研
-
有江 浩明
理化学研究所脳科学総合研究センター
-
有江 浩明
早大
-
菅野 重樹
早大WABOT-HOUSE研究所
-
菅野 重樹
早大
関連論文
- 18・4 総務省・農林水産省系プロジェクト(18.ロボティクス・メカトロニクス,機械工学年鑑)
- 5R-5 A Music Retrieval Approach from Alternative Genres of Query by Adjusting Instrument Volume
- 3D-3 ロボットによる卓上物体操作のためのRNNを用いた道具身体化モデルの構築(人工知能(1),一般セッション,人工知能と認知科学)
- ALL-N-023 森林作業支援システムの開発 : 木登りロボットWOODY(NEDO次世代ロボット実用化プロジェクト(プロトタイプ開発支援事業),生活を支援するロボメカ技術のメガインテグレーション)
- 4R-3 Probabilistic Classification of Monophonic Instrument Playing Techniques
- 双腕作業機の知能化インタフェースに関する研究 : 環境の複雑性および操作者の多様性に非依存な基底作業状態
- ロボットの実用化に関する一考察
- 人間共存ロボットにおける生活支援のためのビジョン技術
- 神経回路モデルの感覚・行為予測に基づく空間認知モデル
- 林業高度化に向けたロボティクスへの期待
- 人間共存ロボットの觝触適応行動 : 第15報:触覚インタラクションアーム肘・手首4関節の設計(人間機械協調2)
- 3C1-1 片麻痺リハビリにおける両肢角度誤差BFリハビリ支援システムの試作と評価(OS6:認知・運動機能の計測・支援,オーガナイズドセッション)
- Predicting Object Dynamics From Visual Images Through Active Sensing Experiences
- Experience-based imitation using RNNPB
- Drumix: an audio player with real-time drum-part rearrangement functions for active music listening (特集 インタラクション技術の原理と応用)
- Instrogram: Probabilistic Representation of Instrument Existence for Polyphonic Music (特集:便利で身近な音楽情報処理)
- Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance (論文特集:人間と共生する情報システム)
- 6T-7 Robot Musical Accompaniment : Real-time Synchronization using Visual Cue Recognition
- 次世代ロボットのキーテクノロジーは何か
- ロボットが「自己」を意識するとき (特別企画 脳とこころ)
- 2A1-N8 人間共存ロボットの觝触適応行動 : 第7報:作業拘束に応じた移行動作生成システム(75. ヒューマノイドの行動実現)
- 2P2-79-103 人間共存ロボットの觝触適応行動 : 第 4 報 : 双腕・体幹を用いた觝触追従動作生成法
- 可聴音波を用いたAHによる遮蔽物の検出と距離推定法(立体音響・音場制御/一般)
- 2A1-N-056 人間共存ロボットの觝触適応行動 : 第19報:受け手の状態を考慮した觝触動作生成モデルの提案(人間機械協調3,生活を支援するロボメカ技術のメガインテグレーション)
- 人間共存ロボットの觝触適応行動 : 第16報:能動的觝触認知のための触覚・運動情報の統合化処理(人間機械協調2)
- 1ZN-2 Score Following by Particle Filtering for Music Robots
- ロボットで「科学」する記号の問題
- 6W-8 MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音楽音響信号による室内音場共振周波数のブラインド推定
- 3C1-2 運動感覚伝達装置を活用した麻痺指伸展リハビリプログラムの開発及び検証(OS6:認知・運動機能の計測・支援,オーガナイズドセッション)
- 2A1-S-047 操作力多面体に基づく力方向操作性と安定性を考慮した力作業姿勢制御(ヒューマノイド3,生活を支援するロボメカ技術のメガインテグレーション)
- 行為における合成可能性メカニズムの自己組織化について : 神経系力学系からの説明
- 1X-3 ロボットの順逆モデルの変換による他者行為予測と模倣(ロボット,学生セッション,人工知能と認知科学)
- 2P2-1F-F2 情緒交流ロボット WAMOEBA-3 の開発 : トルクセンサ内蔵関節の設計
- Interactive ECを用いたコミュニケーションロボットのための反射的行動の獲得(進化・学習とロボティクス3)
- 動作模倣による人間とロボットのインタラクション : 手先軌道データを用いた動作予測システムの構築(情緒・感性・身体性)
- 2A1-N-060 人間共存ロボットの觝触適応行動 : 第20報:環境との接触を回避しつつ人間追従性と作業性の両立が可能な全身運動制御(人間機械協調3,生活を支援するロボメカ技術のメガインテグレーション)
- 2A1-K11 人間共存ロボットの觝触適応行動 : 第 10 報 : 触覚情報分析に基づく觝触状態識別システムの設計
- 6X-1 神経回路モデルによる動作・言語変換を利用した人間ロボット音声協調(音声・言語処理,学生セッション,人工知能と認知科学)
- "情"が作る真のコミュニケーション (「動き・かたち」と「思考」のサイエンス ロボットイノベーション) -- (人間を科学する--ヒューマノイドの知・情・意)
- Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments
- Self-organization of Dynamic Object Features Based on Bidirectional Training
- Human Tracking System Integrating Sound and Face Localization Using an Expectation-Maximization Algorithm in Real Environments
- 緊張性気胸の遠隔穿刺治療を支援する前胸部装着型RT : 第2報 : 車両の走行振動下における穿刺可能性に関する検討
- 2A1-N-040 ロボットの行動に基づいた言語学習モデル : タスクに接地した意味概念の組み合わせ的な理解(認知ロボティクス1,生活を支援するロボメカ技術のメガインテグレーション)
- 農業支援 いちご収穫ロボットプロジェクト--表裏両面から収穫可能なロボットの提案
- 自己モデルの投影に基づくロボットによる他者発見と動作模倣
- Mixture of RNN expertsによるルールダイナミクスの学習(機械学習によるバイオデータマインニング,一般)
- ロボットのボトムアップ・トップダウン相互作用における意識的及び無意識的プロセス(基研研究会「認知科学の数理的基礎づけに向けて」,研究会報告)
- Selecting Help Messages by Using Robust Grammar Verification for Handling Out-of-Grammar Utterances in Spoken Dialogue Systems
- 1P1-F11 自己形態主張を行うカスタマイズ可能なコミュニケーションロボットの研究
- 1P1-E21 ハードウェアをカスタマイズできるコミュニケーションロボットにおける研究 : 形態主張行動の可能理解性がユーザに与える効果の検証
- 1P1-G11 ユーザのカスタマイズを受容・拒否できる機構を持つロボットシステムの開発(コミュニケーション・ロボット)
- 2P1-D18 IECを用いたコミュニケーションロボットにおける人間の主観変化への適応
- 2A2-A21 受動柔軟性を活用したハンド持ち替え制御と安定化手法
- 2A2-A20 全面柔軟被覆を備えた人間形ハンドのための接触頻度・寄与度に基づく触覚センサ設計
- 2A1-D17 人間共存ロボットの觝触適応行動 : 第26報 : 作業拘束の段階的解除による人間追従性と作業性の両立手法
- 1A2-D05 油圧駆動型双腕ロボットアームシステムの開発 : 次世代知能化建機の研究・開発用プラットフォーム
- 1A2-D04 操作型作業機械の知能化に関する研究 : 第5報:操作支援に着目した作業特性および操作支援フラグの識別
- 2A1-D23 人間共存ロボットTWENDY-ONEのデザイン(ヒューマノイド)
- 2P1-E04 生活支援を目的とした車椅子搭載型ロボットアームの開発 : 自重補償機構による軽量・コンパクト性の実現を目指したシリアルリンク型ロボットアーム(医療・福祉ロボティクス・メカトロニクス)
- 18・4 総務省・農林水産省系プロジェクト(18.ロボティクス・メカトロニクス,機械工学年鑑)
- 1A1-E08 木登り枝打ちロボットWOODYの開発 : 幹把持力調整機能による操作の簡便化
- 1A2-D07 街路樹登りロボットWOODY-2の開発
- 1A2-C08 内外両側アプローチ可能ないちご収穫ロボットにおける果柄接触取込型エンドエフェクタの開発
- 2A1-M10 緊張性気胸患者の搬送時救命治療を支援する胸部装着型自動穿刺ロボットAIDEDの開発
- 2A1-M08 遠隔救急超音波診断ロボット:FASTele-1の評価 : 通信遅れが及ぼす診断性能への影響
- 2A1-D06 RTミドルウェアを用いた車椅子搭載型ロボットアーム・システムの開発
- 2A1-A20 他者の動作から発見した運動プリミティブの組み合わせによる模倣動作の生成 : 自他の対応関係を伴った動作の分節化
- 2P2-G11 自己組織化回路素子SONEの制御回路構造形成メカニズム : 移動ロボットの衝突回避学習における制御回路構造の発達(進化・学習とロボティクス)
- 2P1-G06 物体操作に関する脳の情報処理構造を参考にした運動学習モデル : 身体モデルと目標運動軌道との並行学習(脳科学・神経科学とロボティクス)
- 2P1-G05 神経調節機能を参考とした自律エージェントの神経制御器の開発(脳科学・神経科学とロボティクス)
- 2A1-B10 ニューラルネットによる腱駆動ロボットアームの制御 : ランダムな運動からの逆モデルの学習(移動知)
- 2A1-E07 CTRNNを用いた連続な状態空間における強化学習法の提案
- 2P1-H07 未来型住居を想定したロボット群によるホームサービスの試み(空間知)
- 緊張性気胸の遠隔穿刺治療を支援する前胸部装着型RT
- 2P1-D19 人間-ロボット間コミュニケーションのための自律系と情動表出の段階的進化
- 2P1-D13 人間共存ロボットの觝触適応行動 : 第23報:觝触特徴量の時間遷移に応じた觝触状態の連続的同定手法の提案
- 2A1-E03 自己組織化ネットワーク素子群における対ノイズ性能の向上
- 1P1-F05 バイオフィードバックを用いた自己受容感覚リハビリ支援システム : 第2報:体勢感覚回復訓練における視覚依存回避手法の提案
- 2A2-C23 人間形ハンド・アームによる道具の微細操作に関する研究 : 受動柔軟性を活用した動作計画及び把持・作用力・軌道制御
- 2A2-C21 未知重量・摩擦・剛性対象物に対する把持力設定手法 : 受動柔軟性を利用した持ち上げ前特性計測の活用
- 1A1-A19 RTミドルウェアを用いたいちご収穫ロボットのシステム設計
- 1A1-D14 収納機構を備えた軽量・コンパクトな車椅子搭載型ロボットアームの開発
- 1P1-C19 自己形態主張型カスタマイズロボットの開発 : カスタマイズ要求時における音を用いた主張行動の検証
- 1P1-C18 ハードウェアをカスタマイズできるコミュニケーションロボットに関する研究 : ロボットの理想形態への理解度推定に基づく動作生成
- 2A2-G28 遠隔救急治療のための体幹装着型ポータブル超音波診断ロボットFASTeleの操作インタフェースに関する検討
- 2A2-G27 救急搬送時における出血源位置抽出のための体幹適応型RTエコーデバイスBASIS-1の開発
- 1P1-F06 バイオフィードバックを用いた自己受容感覚リハビリ支援システム : 第1報:異種運動速度を取り入れた知覚・運動モデル再構築手法
- 2A2-B22 RTCの繋ぎ替えによるロボット制御管理ソフトウエア「FIROSOPHY」の開発
- 2A2-B21 科学計算システムscilabのためのRTミドルウエア接続ツール「RTC-scilab」の開発
- 1A2-A27 受口追口切りを可能とする樹木伐倒ロボットの開発
- 実験モデルとしての鳴禽類の歌制御システム
- 血流量測定のための変動血管に追従可能な呼吸情報を用いたビジュアルサーボシステムの開発
- SICE Annual Conference 2011 (SICE2011)
- 内側収穫ロボットを用いたイチゴ果実への接近収穫方法の検討
- 2P2-M03 自らの行為経験に基づいた言語学習モデル : 複数の文法構造をもつ文の学習における汎化(脳・神経・認知ロボティクス)
- 1A1-A03 果実の着果状態に着目したいちご収穫ロボットの収穫難易度判定方法の検証(農業用ロボット・メカトロニクス)
- 1A1-L09 準最適運動計画のための機械モデルに応じた位相空間分割手法(動作計画と制御の新展開)
- 2A1-D09 自己形態主張カスタマイズロボットの開発 : ユーザの自己効力感向上がインタラクションに与える効果の検証(コミュニケーション-ロボット)