強化学習を用いた進化的アルゴリズムのパラメータ学習
スポンサーリンク
概要
- 論文の詳細を見る
遺伝的アルゴリズム(GA)など進化的アルゴリズムを利用した探索手法はパラメータが適切に設定されていれば,高い能力を発揮するが,そのパラメータ設定は難しく,問題パターン毎の最適化手法を個別に開発する必要があった.そのため高度な専門知識と大量の検証実験を必要としてきた.この問題を解決するため,進化的アルゴリズムのパラメータを適応的に制御する適応型パラメータ制御と呼ばれる手法が新しく提案されている.しかし,これは主に良い個体を生成した探索オペレータの選択確率を上げていくといった方法で,即時的な探索結果だけをパラメータ制御に反映させるため,近視眼的な最適化になる可能性がある.一方,強化学習を用いて長期的に最適な GA のパラメータ制御を実現しようとする手法も提案されているが,探索オペレータの計算コストや GA の多点探索手法としての特性を考慮していないため,効率改善の余地がある.本論文では,報酬決定則として探索オペレータの計算コストと GA の多点探索手法としての特性を考慮した報酬決定則を実装した強化学習を用いる事により,効率的に進化的アルゴリズムのパラメータ制御を行う手法を提案する.
- 一般社団法人情報処理学会の論文
- 2009-09-03
著者
-
櫻井 義尚
東京電機大学
-
鶴田 節夫
東京電機大学
-
鶴田 節夫
東京電機大学 情報環境学部 情報環境学科
-
櫻井 義尚
電気通信大学
-
鶴田 節夫
東京電機大 情報環境
-
櫻井 義尚
東京電機大学情報環境学部情報環境学科
-
鶴田 節夫
東京電機大
-
櫻井 義尚
東京電機大学 情報環境学部 情報環境学科
関連論文
- Web 利用共同開発支援向け先端メディア融合方式の研究
- 個人の主観的イメージを自動学習する検索手法
- 配送ルート最適化のための内部多世界GA
- 配送ルート最適化のための内部多世界GA
- 制約付きTSPを解くための局所利己的遺伝子許容動的制御GA
- 制約付きTSPのための局所利己的遺伝子動的制御GAの提案(セッション2)
- 大規模TSPを対話的応答時間内で最適化するための多段知能型GA(セッション2)
- 制約付きTSPのための局所利己的遺伝子動的制御GAの提案(セッション2)
- 大規模TSPを対話的応答時間内で最適化するための多段知能型GA(セッション2)
- 制約付きTSPのための局所利己的遺伝子動的制御GAの提案
- 大規模TSPを対話的応答時間内で最適化するための多段知能型GA
- 配送問題を対話的時間で実用レベル最適化する多段知能型GA
- 利己的制約充足型GAによる幹線物流網構築手法
- マルチステージGAによる共同物流網における配送計画作成手法
- 利己的制約充足型GAによる幹線物流網構築手法
- セール指向Eコマース商品グループ管理の一方式
- 2R-2 Eコマース向けセール指向商品グループ管理の一方式(文書管理,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- セール指向Eコマース商品グループ管理の一方式
- 最短道順の実時間探索ための複数方策メタ戦略融合GA方式
- 最短道順の実時間探索ための複数方策メタ戦略融合GA方式
- 強化学習を用いた進化的アルゴリズムのパラメータ学習
- 共同作業管理のための文脈利用方式(協調作業(2))
- 進化型計算法の自律協調型開発環境の研究--遺伝的アルゴリズムによる配送ルートの最適化
- 配送スケジュールの進化計算型リアルタイム最適化技術の研究
- 連続な状態行動空間において近傍状態の報酬予測を用いた強化学習(エージェント・学習)
- パターン情報に基づく能動的学習法による非線形システムのモデリングと制御への適用
- 2-401 能動的学習法を用いた制御知識の獲得
- 能動的学習法による鉄棒体操演技知識の獲得
- 物流最適化に向けたGAとバックトラックの融合によるTSP近似解法
- 配送ルート最適化向けランダムリスタート融合GA方式
- 方策を自律学習する進化型計算法による配送ルートの最適化
- 行動・認知モデルに基づく分散共同開発支援用マルチエージェントシステムの研究
- 能動的学習法の制御問題への適用に関する考察
- 配送ルート最適化向けランダムリスタート融合GA方式