Online Profit Sharingにおける計算量を削減するアルゴリズムの提案
スポンサーリンク
概要
- 論文の詳細を見る
従来のProfit Sharing (Off-PS)はオフライン更新型であり,選択した状態行動対をすべて記憶する必要がある.そのため,使用するメモリ量に上限がなくなってしまう欠点がある.それを改善したのが,オンライン更新型PS (On-PS)である.このOn-PSでは,従来のOff-PSと等価ながら,メモリ量を有限とすることができる.しかし,On-PSでは計算時間がOff-PSよりもはるかに大きくなってしまう問題がある.そこで,本研究ではOn-PSで計算時間を減らす方法を提案し,計算量が大幅に減少することを理論的に述べる.また,Acrobot ProblemにOff-PS,On-PS,提案法を実装することによって,メモリ量や計算時間の観点からの比較し,提案手法の有効性を示す.
- 社団法人電子情報通信学会の論文
- 2006-03-08
著者
関連論文
- 3P7a-10 肝エコー画像におけるスペックルリダクションへの独立成分解析の適用(ポスターセッション)
- 量子力学的チャネルを用いたJaynes-Cummingsモデルの記述と情報量による解析(量子情報理論とその応用)
- 量子相互エントロピーによる量子増幅過程の解析(量子確率論とエントロピー解析)
- スクイズド真空状態による誤り確率の改善
- スクイズド真空状態の量子通信過程への応用
- 量子テレポーテーション過程の量子情報論的アプローチ(量子確率論とエントロピー解析)
- 実環境内におけるロボットの Q-learning とその行動政策の逐一修正の検討
- 肝エコー信号における独立成分の抽出
- 独立成分分析による肝エコー信号からの病変情報分離(医用超音波・アコースティックイメージング)
- A-2-4 GAによるCPGパラメータの最適化と足踏みシミュレーション(A-2.非線形問題,一般講演)