強化学習を用いた進化的アルゴリズムのパラメータ学習

概要

論文の詳細を見る
遺伝的アルゴリズム(GA)など進化的アルゴリズムを利用した探索手法はパラメータが適切に設定されていれば,高い能力を発揮するが,そのパラメータ設定は難しく,問題パターン毎の最適化手法を個別に開発する必要があった.そのため高度な専門知識と大量の検証実験を必要としてきた.この問題を解決するため,進化的アルゴリズムのパラメータを適応的に制御する適応型パラメータ制御と呼ばれる手法が新しく提案されている.しかし,これは主に良い個体を生成した探索オペレータの選択確率を上げていくといった方法で,即時的な探索結果だけをパラメータ制御に反映させるため,近視眼的な最適化になる可能性がある.一方,強化学習を用いて長期的に最適な GA のパラメータ制御を実現しようとする手法も提案されているが,探索オペレータの計算コストや GA の多点探索手法としての特性を考慮していないため,効率改善の余地がある.本論文では,報酬決定則として探索オペレータの計算コストと GA の多点探索手法としての特性を考慮した報酬決定則を実装した強化学習を用いる事により,効率的に進化的アルゴリズムのパラメータ制御を行う手法を提案する.
一般社団法人情報処理学会の論文
2009-09-03