大域結合カオス系に基づく強化学習による自律ロボットの行動獲得 : 第1報, 信頼度割り当ておよび汎化方式に関する考察
スポンサーリンク
概要
- 論文の詳細を見る
We describes a framework for the acquisition of perception-based navigational behaviors in autonomous mobile robots. Globally coupled chaotic system is applied to learn reactive action-rules. The control architecture of a robot consists of chaotic elements each coding an action-rule. The elements have the dynamics, which are designed so that the elements can collectively execute reinforcement learning. We carried out simulations on a navigation task in a static environment. Then, we observed the reproduction process and utility transition of the action-rules to examine how the robot acquire behaviors. Simulation results demonstrate that the robot successfully acquired behaviors such as goal-reaching, wall-following, and collision avoidance without any prior knowledge of the task space. The observation indicates that the stability of the acquired behavior depends on the types of the credit assignment and that the progress of the generalization of the state space correlates to the learning performance in a trial.
- 一般社団法人日本機械学会の論文
- 1997-11-25
著者
関連論文
- 公共財供給問題としてのインフォーマルコミュニケーションのモデル化と創出メカニズムの分析(エージェントベースシミュレーション,ソフトウェアエージェントとその応用論文)
- 情報の局在性を考慮したネットワーク環境における協調行動の創発(ネットワークが創発する知能)
- ネットワーク外部性をともなう市場における情報非対称性と購買行動(参加型シミュレーション,マルチエージェントの理論と応用)
- 溝型チップブレーカ工具による切削過程の三次元有限要素法解析
- 人工物の構造化と価値創成
- 生産システムの新しい概念(3.1 各分野の現状,3.精密工学の今,創立75周年記念)
- 自己の内的テンポを考慮した二者間の協調的リズム生成のモデル化
- 人工物の価値とサービス研究(サービスイノベーションとAIその2)
- 相互引き込みモデルに着目した音楽的周期性の創発に関する研究(セッション5)
- 異なる時系列をもった視聴覚信号による人間のリズム生成に関する研究
- 中心音を考慮したわらべうたの創発的設計(楽曲・コンテンツ生成)
- 創発とシンセシス : 人工物デザインから価値共創へ
- 2103 マルチエージェント学習による工程と日程の同時的計画手法(OS2-1 計画手法)
- 2203 限定合理的エージェントを導入した自己組織化生産システムに関する研究(OS2-2 エージェント技術の適用)
- マルチエージェント学習を用いたCO2冷媒ヒートポンプ給湯機ネットワークシステム
- 1B1-2 ネットワーク外部性を伴う市場における新製品導入の意思決定に関する研究(1B1 OS:共創・価値創成)
- 1B1-1 強化学習を用いた認知的特性に基づく旋律生成(1B1 OS:共創・価値創成)
- 2107 半導体生産システムにおける遺伝的機械学習を用いた適応的ロット投入(OS2 生産スケジューリング)
- マルチ・エージェント学習モデルを用いた音楽的構造の創発
- 協調型共進化GAによる動的施設配置問題の一解法
- 共進化ダイナミクスおよび共生関係の生成
- 根井の標準遺伝距離を用いた neutrality を含む問題でのGAの進化ダイナミクス解析
- 根井の標準遺伝距離を用いた適応度景観に含まれる neutrality の推定 : 進化ロボティクスへの適用
- 遺伝的浮動を利用する進化的プログラミング
- 不完全同定モデルによるエージェントの認知機構の構築
- 不完全同定モデルによるエージェントの認知機構の構築
- 相互引き込みモデルに着目した音楽的周期性の創発に関する研究(セッション5)
- 社会的インタラクション分析のための被験者実験を用いたマルチエージェント手法の提案(「社会的インタラクションにおける知」及び一般)
- 進化的計算手法を用いた適応成長型形状表現
- 強化学習による自律型アームロボットの協調行動獲得
- マルチエージェント環境における強化学習の一適用法
- マルチエージェント環境における強化学習の一適用法(機械力学,計測,自動制御)
- 強化学習による協調搬送問題へのアプローチ : 実機による検証
- Design and Adaptive Reconfiguration of the Manufacturing System Shop-floor based on the Emergent Synthesis approach
- 動的陽解法弾塑性FEMによる三次元切削過程のシミュレーション : 計算手法の開発と旋削加工シミュレーションへの適用
- 走査型トンネル顕微鏡および分子動力学法によるグラファイトの原子レベル材料除去機構の考察
- ボイド材における陰解法弾塑性FEMの基礎的定式化と切削シミュレーションへの適用
- 原子間力顕微鏡の走査機能を利用したマイクロ切削過程の連続観察
- 授賞論文「均質な自律ロボット群による協調行動獲得問題 : 機能分化に基づくアプローチ」(学会賞の贈呈 : 2003年度学会賞論文賞)
- 結合優先関係グラフに基づく製品の組立順序の生成 : 第1報, 結合優先関係グラフの定義とその操作方法
- 自律分散型生産システムの設計と運用に関する研究 : 第2報,異常事象を考慮したスケジューリングへの適用
- Instance-Based Classifier Generator による連続空間の自律的構成
- 分子動力学法-剛塑性有限要素法連成解析による原子レベル切削機構のシミュレーションの試み
- 複数アームロボットによる荷上げ協調行動の獲得
- Instance-Based Classifier Generator による自律移動ロボットの行動獲得
- 工具損傷におけるCAE利用技術 : (切削加工におけるCAE利用技術)
- セラミックスのレーザ熱衝撃における熱き裂の破壊力学的解析
- 陰解法弾塑性有限要素法による切削機構の解析(第2報) : チップブレーカの作用による切りくず生成のシミュレーション
- 陰解法弾塑性有限要素法による切削機構の解析 : radial return法による定式化と切りくずカール解析
- 三次元切削機構の剛塑性有限要素法による解析(第2報) : 平フライス切削過程のシミュレーション
- 剛塑性有限要素法によるフライス切削過程の三次元シミュレーション -第2報 平フライス上向き削りの解析
- 三次元切削機構の剛塑性有限要素法による解析 : 傾斜切削における切りくず生成機構
- Gurson型降伏関数に基づく弾塑性有限要素法による切りくず生成機構のシミュレーション
- 超硬合金工具材料の微視的変形挙動の有限要素法による解析
- 自律ロボットの行動獲得のための制御アーキテクチャ : 大域結合カオス系を用いた強化学習
- 大域結合カオス系に基づく強化学習による自律ロボットの行動獲得 : 第2報, 動的環境におけるナビゲーション行動の学習
- 大域結合カオス系に基づく強化学習による自律ロボットの行動獲得 : 第1報, 信頼度割り当ておよび汎化方式に関する考察
- カオスを用いたエージェント間の関係活性化モデル
- 自律エージェント行動戦略と通信の進化的獲得過程に関する一考察
- シンセシス問題と創発的方法論
- 創発とシンセシス
- アモルファス金属のマイクロ切削における切りくず生成に伴う層状すべり機構の解析
- F02-(2) 創発的設計へのアプローチ
- A Genetic Algorithm for Nonstationary Function Optimization Problems