強化学習を用いた最適スーパバイザの構成

元データ 2001-05-18

概要

本報告では, 強化学習を用いたスーパバイザの構成法を提案する. 離散事象システムにおいて, スーパバイザはシステムの仕様を満たすように可制御な事象の生起を制御する. 一般に, スーパバイザはオートマトンと言語理論に基づいたアルゴリズムによって導かれ, 対象システムと制御仕様の正確な記述が必要とされる. 提案アルゴリズムでは, 強化学習を用いて制御パターンを学習する. このとき, 事象の生起と禁止に関してのコストを考慮することにより, 不確かな環境や陽でない仕様の下でも最適なスーパバイザを求めることができる. また, 計算機実験によって, 提案手法の有効性について調べる.

著者

潮 俊光 大阪大学大学院基礎工学研究科
山崎 達志 摂南大学工学部
山崎 達志 摂南大学理工学部
山崎 達志 大阪大学 大学院 基礎工学研究科
山崎 達志 大阪大学大学院基礎工学研究科システム人間系専攻

関連論文

▼もっと見る