関数近似を用いた強化学習のKheperaロボットへの応用(システム制御)
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement learning is made by the interaction with environment. But it is difficult to apply reinfocement learning to robots as it is. Because enormous time of computation is needed. This paper proposes a method which uses function approximation for Reinforcement learning, and employs it to Khepera robot's feature efficiently in an actual environment.
- 社団法人日本オペレーションズ・リサーチ学会の論文
- 2004-03-17
著者
関連論文
- 異常値を含む大規模データに対するサポートベクター回帰の効率的学習法
- モデル予測多目的最適化
- 3404 ラディアルベーシス関数と領域適合型遺伝的アルゴリズムを用いた近似最適化 : 探索領域の絞込みに関する検討(OS03/近似最適化)
- 1920 RBFネットワークを利用した多目的近似最適化手法の開発(OS-19D 進化的最適化,OS-19 計算力学と最適化)
- RBFネットワークと領域遺伝型遺伝的アルゴリズムを用いた近似最適化手法の開発 : 推奨関数に関する検討(設計と最適化I)
- RBFネットワークと領域遺伝型遺伝的アルゴリズムを用いた近似最適化 : 推奨関数の提示と基礎的な検討(機械力学,計測,自動制御)
- プラント配置設計の多目的最適化 : 第1報,遺伝的アルゴリズムによる構内配置問題の最適設計(機械要素,潤滑,設計,生産加工,生産システムなど)
- 計算知能を用いた逐次近似多目的最適化手法
- サポートベクターマシンによる対策工効果を考慮した土石流危険渓流の危険度評価
- 207 計算知能を用いたハイブリッド型多目的最適化法
- 計算知能を用いる多目的近似最適化手法
- 2202 データ包絡分析法を用いたトレンド分析法の開発 : 技術的トレンドと市場ニーズの関係について
- 1304 RBF を用いた近似最適化 : 離散変数との混合最適化の場合
- 107 領域遺伝型遺伝的アルゴリズムを用いた多目的最適設計
- J1201-4-3 発電プラント機器配置計画の多目的最適化(解析・設計の高度化・最適化IV)
- 205 RBFを利用した満足化トレードオフ法の近似解法
- 非線形最適化に対する二重準ニュ-トン法の提案
- 2215 近似最適化を用いた発電プラント運用の多目的最適化(OS3 近似最適化(II),未来社会を支えるものづくりとひとづくり(設計・システムから))
- 4301 対話型多目的計画法を用いた火力発電プラントの起動スケジューリング(S62-1 高効率石炭火力発電(1),S62 高効率石炭火力発電)
- リメディアル教育における数式入力式ドリルシステムの応用に関する研究
- ソフトセンサのための外れ値検出手法 (第26回センシングフォーラム資料--センシング技術の新たな展開と融合) -- (センシングシステム(2))
- eラーニングのための数式自動採点システムの構築 (eラーニング環境のデザインとHRD(Human Resource Development)/一般)
- 文の構造を利用した記述式問題の自動採点
- e-Learningシステムにおける学習者の質問への自動応答
- 関数近似を用いた強化学習のKheperaロボットへの応用(システム制御)
- 学習者の入力情報に基づくコンテンツ配信制御システムの構築
- 多目的最適化・満足化について
- 制限付き表情合成について
- 似顔絵による表情作成システムの構築
- 構造最適設計のための改良型満足化トレ-ドオフ法に関する研究
- 多目的意思決定--理論と応用-7-確率優位則と対話型モデリング
- 多目的意思決定--理論と応用-5-対話型計画法
- 多目的意思決定--理論と応用-1-多目的意思決定とAHP
- 多目的決定の動向と展望 (多目的計画の応用特集号)
- 多目的計画に対する満足化トレ-ドオフ法の提案
- 滑らかな主観的凸計画法
- 多目的システム (〔日本自動制御協会〕創立20周年記念特集号) -- (システム制御理論--その現状と将来)
- 3403 計算知能による目的関数予測にもとづく最適化(OS03/近似最適化)
- 2202 一般化包絡分析法を用いた工学設計(G01-1/一般(1))(G01/一般)
- 2111 DEA を用いた設計指針の検討
- 似顔絵における表情作成について
- 似顔絵による表情作成システムについて
- 2212 多目的最適化における近似の利用に関する考察(OS3 近似最適化(I),未来社会を支えるものづくりとひとづくり(設計・システムから))
- 2211 近似最適化手法の比較について(OS3 近似最適化(I),未来社会を支えるものづくりとひとづくり(設計・システムから))
- 豪雨時の道路事前通行規制基準雨量の設定に関する研究
- 回帰とRBFを利用した近似最適化
- RBFによる近似最適化手法の満足化トレードオフ法への利用(設計と最適化II)
- 包絡分析法を用いた客観的な急傾斜地崩壊対策施設整備優先順位設定法
- 感度を考慮した SVM による逐次的追加学習と忘却
- 多目的意思決定とその応用
- 2201 DEAを用いたがけ崩れ発生限界雨量線の設定(G01-1/一般(1))(G01/一般)
- 一般化包絡分析法を用いた多目的PSO法
- システム設計における多目的性(システム設計における多目的性)
- 数式処理システムを用いた数式採点の枠組み
- 知能型e-Learningシステム (2003年度サイバーキャンパス整備事業補助金によるコンテンツ作成の概要)
- コミュニケーションロボットii-1号の制作
- 1107 データ包絡分析法を用いた総合技術指標の構築手法 : 第4報 製品系列を考慮した市場ニッチの探索(OS10-2 設計における知識マネジメント・情報共有II,OS10 設計における知識マネジメント・情報共有)
- 212 プラント配置設計の多目的最適化
- B-24 コンバインドサイクル発電プラントの起動スケジュールの多目的最適化(開発・性能II,一般講演)
- 2-K-4 大規模問題に対するサポートベクター回帰におけるパラメータチューニング(連続最適化)
- 第66回シンポジウムルポ(情報の窓)
- 計算知能の逐次近似多目的最適化への応用(インテリジェント技術とOR)
- 期待改善量と一般化包絡分析法を用いたパレート最適解の生成法
- コミュニケーションロボット同士による漫才