ARTニューラルネットワークによる強化学習のための状態生成器の改良
スポンサーリンク
概要
- 論文の詳細を見る
強化学習の研究では"探査と知識利用の間のトレードオフ"がしばしば議論される。これは、探査と知識利用が解のクオリティと学習効率の向上にそれぞれ影響するためである。以前、我々が提案したARTニューラルネットワークに基づく適応的な状態空間の分割法は、解のクオリティと学習効率のバランスという観点からも有用な方法である。しかし、探査強度が大きくなり過ぎると学習効率が急激に低下する傾向がある。さらに、適切な探査強度は一般的に不明であるため、これは解決すべき問題であるといえる。そこで本論文では、ARTに2つの学習フェーズを用意することで、探査強度に対して耐性を持つように従来法を改良する。
- 2005-06-16
著者
-
神尾 武司
広島市立大学
-
藤坂 尚登
広島市立大学
-
三堀 邦彦
拓殖大学
-
三堀 邦彦
海上保安大学校
-
藤坂 尚登
広島市立大学情報科学部
-
中村 太亮
広島市立大学情報科学部
-
中村 太亮
広島市立大学 情報科学部
関連論文
- 単電子トンネリング・デバイスを用いた帯域通過ディジタル・ウェーヴ・フィルタ
- 単電子トンネリング・デバイスを用いた帯域通過ディジタル・ウェーヴ・フィルタ
- マイクロ波帯LN光変調器の高周波化・高感度化のための最適な電極構造の検討(レーザ・量子エレクトロニクス)
- マイクロ波帯LN光変調器の高周波化・高感度化を図るための最適な電極構造の検討(RCS:無線回路,無題QoS,無線リソース制御,アドホックネットワーク,信号処理,無線通信一般)
- イジングスピングラスを用いた低信頼性ナノスケール論理回路の誤り訂正
- Power consumption for coherent optical orthogonal frequency division multiplexing with punctured LDPC codes and variable amplitude block codes (ワイドバンドシステム)
- B-8-21 Time-Frequency Interferometry for OFDM
- 強化学習による避航進路の決定
- 強化学習による多船航路探索法(生命現象,一般)
- 船舶航路決定と強化学習アルゴリズム