D-8-29 強化学習における価値関数の分散最小化によるメタ学習
スポンサーリンク
概要
- 論文の詳細を見る
- 2003-03-03
著者
-
松本 隆
早稲田大学大学院先進理工学研究科電気・情報生命専攻
-
松本 隆
Department Of Electronical Engineering Waseda University
-
松本 隆
Waseda University
-
松本 隆
早稲田大学大学院電気・情報生命専攻
-
阿知波 健
早稲田大学大学院理工学研究科電気・情報生命専攻
-
松本 隆
科学技術振興事業団
関連論文
- 2F-4 文字入力支援システムDasherの日本語実装(インタフェースデザイン,一般セッション,インタフェース)
- Zipf事前分布を用いたマウス核内受容体遺伝子発現制御ネットワーク予測アルゴリズムのモンテカルロ法による実装
- D-2-5 low-discrepancy 列を用いた Markov Chain Monte Carlo
- D-2-6 Sequential Monte CarloによるHyperparameterのOn-Line学習
- 状態維持確率にポアソン分布を用いた一般化隠れマルコフモデルによる膜タンパク質構造予測
- A Generalized Hidden Markov Model approach to transmembrane region prediction with Poisson distribution as state duration probabilities (バイオ情報学)
- 強化学習の並列型メタ学習 : 学習率の調整(人工知能, 認知科学)
- D-8-25 強化学習の並列モデルメタ学習による動的環境への適応(D-8. 人工知能と知識処理)
- D-8-24 強化学習における進化型メタ学習(D-8. 人工知能と知識処理)
- D-8-29 強化学習における価値関数の分散最小化によるメタ学習
- D-2-18 遺伝的アルゴリズムを用いた強化学習メタパラメータの学習
- N-Homoclinic Bifurcation of Piecewise Linear Vector Fields(Structure and Bifurcation of Dynamical Systems)
- 超並列 CMOS Vision Chip : 階層型正則化フィルタ : 視聴覚技術
- C-12-56 ソフトウェア無線機向け離散時間フィルタの高次化に関する検討(C-12.集積回路,一般セッション)
- A Chaotic Attractor from a 2-segment Piecewise-linear Capacitor Circuit(Theory of Dynamical Systems and Its Application to Nonlinear Problems)
- 2次sinc関数特性を持つチャージサンプリングフィルタの低消費電力化・小面積化の検討(ポスター講演,学生・若手研究会)
- POINCARE MAPS OF THE DOUBLE SCROLL
- A CHAOTIC ATTRACTOR FROM AN AUTONOMOUS 3-SEGMENT PIECEWISE-LINEAR CIRCUIT(Theory of Dynamical Systems and Its Application to Nonlinear Problems)
- M.L.P.におけるARD(Automatic Relevance Determination)の階層Bayes的アプローチ
- M.L.P.におけるARD(Automatic Relevance Determination)の階層Bayes的アプローチ