Q-learning における状態空間の適応的分割法
スポンサーリンク
概要
- 論文の詳細を見る
- 2000-03-23
著者
-
足立 紀彦
京都大学大学院情報学研究科
-
深尾 隆則
神戸大学機械工学科
-
深尾 隆則
神戸大学 工学部 機械工学科
-
深尾 隆則
京都大学大学院情報学研究科システム科学
-
大村 亮祐
富士ゼロックス(株)
-
大村 亮祐
京都大学大学院 情報学研究科
-
足立 紀彦
京都大学大学院情報学研究科システム科学
-
足立 紀彦
京都大学大学工学部応用システム科学教室
関連論文
- 電子線型加速器のビームエネルギーの統計的解析とその制御
- 対象追跡 : フレーム間の類似度に着目した手法から動きのモデルに着目した手法まで(サーベイ(2))
- ツェルニケモーメントを特徴量とする2次元動的計画法を用いたイメージマッチング
- 回転不変量を特徴量とする2次元動的計画法を用いたイメ-ジマッチング--画像間の対応関係をいかにみつけるか
- 間接法によるロボットの適応制御系の一構成法
- 画像情報に基づく制御システム : Research and Life in Carnegie Mellon University(制御,世界がフィールド!)
- 生態学的な行為システムとしての行為調整機構に関する構成論的研究
- Some Results on the Qualitative Theory of Matrix
- 衝撃のあるマニピュレータシステムに対する動的パラメータ表現にもとづく追従制御手法(機械力学,計測,自動制御)
- 動的パラメータ表現による経路追従制御 : 機械力学,計測,自動制御
- 強化学習ロボットによるアフォーダンスの利用
- 強化学習ロボットによるアフォーダンスの利用
- 冗長ロボットマニピュレータの拡張ハイブリッド制御
- 非ホロノミック移動ロボットの適応制御
- 適応制御に基づくスペースクラフトのランデブ・ドッキング(機械力学,計測,自動制御)
- 224 アクティブステアリングのためのハイブリッド制御系設計法(ビークル・コントロール,OS-2:運動と振動のモデリングと制御(1))
- 金出武雄:素人のように考え,玄人として実行する : 問題解決のメタ技術,PHP研究所(2003)
- オクルージョンに対してロバストな2段階特徴点追従アルゴリズム
- 2段階特徴点追従アルゴリズム
- 102 操縦性向上のためのステアリングとブレーキのモデル規範型適応制御
- 101 速度およびスリップ率追従のためのブレーキのハイブリッド制御
- H_∞制御と非線形適応制御機構を有するアクティブサスペンション
- 電気油圧シリンダに対する適応制御用ベンチマーク問題の作成 - SICE 制御部門適応学習制御調査研究会活動報告 -
- 部分的適応制御
- 倒立振子・台車系の部分的適応制御
- 246 非ホロノミックシステムの適応トラッキング制御(ロボットの制御III)(OS ロボットの制御)
- Q-learningにおける状態空間の適応的分割法
- 非ホロノミック移動ロボットの適応トラッキング制御
- スペースクラフトのバックステッピング法による姿勢追従制御
- 147 移動ロボットの軌道計画と制御における視覚情報の利用
- 選好を考慮した交渉シミュレーションシステム
- Q-learning における状態空間の適応的分割法
- 正則化理論を用いた連続的状態と行動を扱う強化学習
- 2P1-S-061 画像情報に基づく飛行船ロボットシステム(飛行ロボット4,生活を支援するロボメカ技術のメガインテグレーション)
- 710 モデル規範型D^*制御による軌道追従自動操舵システム(ビークル・ダイナミクスII)(OS.14 : ビークル・ダイナミクス)
- 社会的相互行為における基礎定位とその調整機構
- 1リンクフレキシブルアームに対する共役型反復学習制御
- 勾配法による反復学習制御と Stable Inversion との関連性について
- 離散時間線形システムに対する勾配法に基づいた反復学習制御
- 正則化理論を用いた強化学習
- 分割統合機能をもつCMACとその非線形信号処理への応用
- 有限な時間区間におけるサンプル値逆系の極限的性質-相対次数2の場合
- 有限時間区間におけるサンプル値系の極限零点と逆システムの性質について
- 線形システムに対する反復学習制御アルゴリズムの設計法
- 線形システムに対する学習制御方式について
- ポジショナー・マニピュレータシステムの強調拘束運動制御
- 冗長マニピュレータのインピーダンス制御
- 力センサを用いないマニピュレータの位置と力の制御
- 微分方程式による根軌跡の計算
- プラント既知情報を利用した適応則
- 局所的な適応フィードバックループを有する制御系の安定性
- 速度規範モデルを有する適応D.C.サ-ボ系のロバスト性解析
- 部分的な規範モデルを有する適応サ-ボ系の安定性
- ピボッティングによる根軌道の計算アルゴリズム
- 1P1-F09 屋内型飛行船ロボットシステムの開発(飛行ロボット・メカトロニクス)
- 1A2-D06 Path Followingに基づいた屋外型飛行船ロボットの滞空制御
- カルマンフィルタを用いた CMAC の一学習法
- ニューラルネットワークを用いた適応制御系の一構成法
- 目的地を越えない非ホロノミック移動ロボットの画像に基づく安定化制御