連続状態空間のための強化学習アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
The most widely used reinforcement learning algorithms, such as TD-learning and Q-learning represent action-value function using a table. Therefore, these algorithms are limited to tasks with small numbers of states and actions. In this paper, we propose a new reinforcement learning algorithm for continuous state spaces, which represents action-value function using Radial Basis Function Network. The algorithm is applied to a mountain-car control task. The results of extensive simulations demonstrate that proposed algorithm can find good solutions.
- 八戸工業高等専門学校の論文
著者
-
阿部 健一
日本大学工学部
-
阿部 健一
日本大学工学部情報工学科
-
阿部 健一
東北大学大学院工学研究科
-
阿部 健一
東北大
-
釜谷 博行
八戸工業高等専門学校電気情報工学科
-
阿部 健一
東北大学大学院工学研究科技術社会システム専攻
-
阿部 健一
東北大 大学院工学研究科
-
阿部 健一
東北大学工学部電気系
-
阿部 健一
東北大学工学部電気工学科
関連論文
- 複雑系モデルを用いた生体循環系ダイナミクスの解析
- 映像酔いに対する自律神経系の2相性反応
- 生体情報を利用した人工心臓の循環制御
- Mayer 波帯域における脈波伝播時間-心拍数間の相互相関を用いた情動反応の定量化
- 血圧-心拍数間の因果的コヒーレンス関数を用いた映像酔いの評価
- 生理的パラメータの相互相関を用いた映像の生体影響評価法
- 左心補助人工心臓駆動下の血行動態と腎交感神経活動
- 関連度関数および伝達関数の手法による動脈圧受容体反射システムの線形性の検討(日本循環器学会 第104回東北地方会)
- 電磁駆動振動ポンプを応用した体血管インピーダンスの実験的検討(日本循環器学会 第104回東北地方会)
- 電磁駆動式振動流ポンプを用いた右心バイパスが肺循環に与える影響に関する実験的検討
- フラクタル理論を用いた人工心臓による血行動態時系列曲線の非線形解析
- 実時間試行に基づくマルチプルコントロールシステムの提案とそのABSへの適用
- 安定性と速応性に関するロバスト性能指標に基づくマルチプルコントロールシステム
- コース制における工学実験の再構築
- 創成実験への取り組みについて
- 電気工学科の改組
- 関数近似手法を用いた強化学習アルゴリズム
- 多楽器演奏音からの単一音源の抽出に関する基礎的検討
- パルス結合RBFネットワークによる音素認識
- 部分観測マルコフ環境における階層型強化学習 : スイッチングQ-学習の提案
- RTN測定の高精度化・高速化技術とRTN特性に強い影響度を示すプロセス条件(携帯電話用カメラ,デジタルスチルカメラ,ビデオカメラ(ハイビジョン)とそのためのイメージセンサ,モジュール,特別企画「CCD誕生40周年記念講演-黎明期-」)
- MOSFET特性ばらつき、RTSノイズの統計的評価(プロセス科学と新プロセス技術)
- Stress Induced Leakage CurrentとRandom Telegraph Signalノイズとの相関(プロセス科学と新プロセス技術)
- プラズマプロセスによるMOSFET特性ばらつきの統計的評価(プロセス科学と新プロセス技術)
- 大規模アレイTEGを用いたランダム・テレグラフ・シグナルの統計的評価(プロセス科学と新プロセス技術)
- CMOSイメージセンサの画素トランジスタのノイズ測定(イメージセンサ一般(IISW報告会含む))
- 微細MOSトランジスタ特性の統計的ばらつき評価手法に関する研究
- オブジェクト指向に基づく乗客流を考慮した列車ダイヤ作成手法
- 乗客流評価に基づく需要適応型列車ダイヤ作成手法
- マイクロ波による鉄道通信システムにおける伝搬特性
- B-5-83 SS方式を用いた鉄道通信システムの検討
- B-1-42 鉄道沿線環境におけるマイクロ波伝搬特性解析
- 連続状態空間のための強化学習アルゴリズム
- 部分観測マルコフ環境におけるスイッチングQ-学習
- 鉄道における新しい情報システムの提案(MRRM)
- 学習オートマトンによる移動ロボットナビゲータのパラメータ自動調整
- オブジェクト指向設計に基づいた自律型移動ロボットの開発支援システム
- 血圧-心拍数間の相互相関を用いた映像刺激の生体評価 : 技術研究報告
- 大規模アレイTEGを用いた画素ソースフォロア相当のトランジスタのランダム・テレグラフ・シグナル・ノイズの統計的解析 (情報センシング コンシューマエレクトロニクス)
- Windows VistaとKNOPPIXを採用した八戸高専教育用計算機システム
- D-6-8 分割可能バス付きアレイ上の高速フーリエ変換
- 平成10年度NHKアイディア対決ロボットコンテスト「イカロス」の開発
- 二重自己組織化マップを用いた人工心臓の自動監視
- 自己組織化ニューラルネットワークを用いた異常生体信号の自動検出
- 大規模な微分方程式に対するWaveform Relaxation法の並列計算機への実装
- 縦型拡散炉のカスケードファジィ温度制御
- 電気炉のファジィ温度制御に関する基礎的考察
- 自動車エンジン空燃比のデュアルモード制御
- MOSFETにおけるランダムテレグラフシグナルの統計的評価方法(プロセス・デバイス・回路シミュレーション及び一般)
- 形状的特徴量抽出に基づく胸部X線CT画像における肺結節陰影パターンの自動鑑別(医用システム)
- 非ホロノミック系における手動制御の学習過程に関する一考察
- 価値関数を用いた非線形手動制御系の学習過程に関する考察
- 脳内神経活動の電磁界解析手法の比較・検討
- カオス的遍歴現象を呈するモード遷移ダイナミクスモデル
- 2重フィードバック型ニューロンモデルの発火ダイナミクス解析
- ニューラルネットワークを用いた顔表情認識
- 仮想空間に生理的・心理的状況を反映するための簡易型生理指標解析装置の評価
- 同時リカレントネットワークによる不連続な非線形関数の統計的近似学習法
- 血圧-心拍数間の最大相互相関係数を用いた映像刺激の生体影響評価
- PDE阻害薬が複雑系としての心機能に与える影響
- 血管内超音波(IVUS)を用いた動脈壁の動き解析
- 定常流人工循環における循環制御
- 結合重みの時空間変化による追加学習ニューラルネット
- 自己励磁誘導発電機の電圧安定度
- 誘導発電機の自己励磁制御
- A-17-21 ミリ波による自動車路車間大容量通信システムの検討
- カオスの応用による加齢現象の加速と制御
- 直交巻コイルによる経皮的電力・信号伝送法の改善に関する検討
- 同時送信可能な区分バス付きアレイによる分割可能バス付きアレイの模倣
- D-6-5 分割可能バスつきアレイ上のDESCEND/ASCEND型計算
- D-6-6 分割可能バスつきアレイ上の全点対間最短経路問題
- 3次元分割可能バス付きアレイ上の論理行列積とその応用
- プロセッサアレイにおけるバスおよびトーラス結合の評価
- 分割可能バス付きアレイにおけるバス競合解消法
- 伝播遅延を考慮した場合の区分バス付きプロセッサアレイの有効性に関する検討
- 2重対数深さ木に基づくPASb上の効率のよい計算
- 区分バス付き格子計算機の評価
- 伝播遅延を考慮した階層型分割可能バスとその評価
- 神経回路網におけるカオスダイナミクスの制御
- 画像情報を用いた鉄道運行監視支援システム
- 乗り物酔いしやすさと3次元映像感受性の関連性の定量的評価
- 定常流完全置換型人工心臓の循環制御と心房壁吸着現象
- 超音波ドプラ画像からの大動脈流量自動推定に基づく非侵襲的E_ 推定
- 心室エラスタンスの直線的変化に基づくE_ 推定法
- IT革命が加速する人工臓器の計測・制御・通信の未来
- 401 定常流人工心臓の差圧・流量推定
- 定常流人工心臓の流量・差圧推定システム
- 自律神経機能評価のための血圧-心拍数応答特性解析
- 非侵襲的心機能(E_・PVA)推定システム
- 左心室圧波形の非侵襲的推定法
- 血圧-心拍数間の相互相関に基づく3次元映像の評価
- 動的認識ネットワークの励起アトラクタに関する一考察
- パラメータ最適化法によるV_0とE_の推定と従来法との比較
- 人工心臓の制御
- 生物的な認識機構をもつ文字認識ニューラルネット
- 出力応答系列に基づく離散時間2自由度制御系の設計法 : 正則化最小二乗法による操作量振動の抑制
- 離散時間型2自由度制御系の時間領域における近似設計法とそのパラメータ調整
- 映像酔いに対する自律神経系の2相性反応(サイバー空間の安全・健康・快適性)
- 埋め込み構造によるMOSFETにおけるランダム・テレグラフ・ノイズの低減(プロセス科学と新プロセス技術)
- 組み込みマイコンと電子回路とWindowsPCを用いたシステムづくり実験の実践と評価