強化学習に基づく時間付き離散事象システムのスーパバイザ制御(コンカレントシステム,離散事象システム,ハイブリッドシステム,及び一般)

元データ 2008-05-27

概要

時間付き離散事象システムは,リアルタイムシステムのように,時間に関する制約を持つシステムの挙動を表現できる。本報告では,時間付き離散事象システムのスーパバイザ制御問題に対し,新たな最適スーパバイザ制御の手法を提案する.山崎らが従来提案している,強化学習を用いた最適スーパバイザの設計手法を拡張し,時間付き離散事象システムのスーパバイザ制御に適用する.提案手法では,事象の禁止コストやタスクの達成・失敗などを,言語測度と呼ばれる符号付き実測度を用いて評価し,最適なスーパバイザを設計する.また,強化学習を用いて設計を行うことで,環境が不確かであったり,制御仕様が精確に記述することが難しい場合についても有効な手法となっている.

著者

潮 俊光 大阪大学大学院基礎工学研究科
山崎 達志 摂南大学工学部
山崎 達志 摂南大学理工学部
山崎 達志 大阪大学 大学院 基礎工学研究科

関連論文

▼もっと見る