Soarにおける強化学習を用いたルール生成機構と競合解消機構の試作
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,強化学習とSoarを用いた問題解決器を提案する.本問題解決器はインパスに入ると自動的に強化学習を呼び出し,強化学習の結果からプロダクションルールを生成する.プロダクションルールは多くの状態で利用できるように汎化される.生成されたプロダクションルールは認識メモリに格納される.認識メモリ内のプロダクションルールが利用できる場合は通常のプランニングを行い,プランニングが不可能となった場合に強化学習を行う.プランニング時に強化学習で得られたルールが複数発火した場合,どのルールを選択するか決定しなければならない.本研究では強化学習で得られたルールの競合を解消する機構を提案する.本問題解決器により,帰納的な学習を行い,その学習結果を用いた高速なプランニングが可能となる.実験では本問題解決器の有用性を示す.
- 日本ソフトウェア科学会の論文
日本ソフトウェア科学会 | 論文
- LCDと透明弾性体の光弾性を用いたユーザインタフェース (特集 インタラクティブシステムとソフトウェア)
- Bluetoothによる位置検出
- COINSにおけるSIMD並列化(最新コンパイラ技術とCOINSによる実践)
- データ型を考慮した軽量なXML文書処理系の自動生成(ソフトウェア開発を支援する基盤技術)
- 計算と論理のための自然枠組NF/CAL(システム検証の科学技術)