部分観測下での最悪ケースに基づくスーパバイザの強化学習(システムと制御)
スポンサーリンク
概要
- 論文の詳細を見る
スーパバイザ制御では,スーパバイザと呼ばれる制御器が離散事象システムに対して,生起を許可する事象の集合(制御パターン)を指定する.筆者らはこれまでに,最悪ケースを考慮した最適スーパバイザを強化学習により設計する手法を提案している.しかしながら,現実のシステムにおいては,すべての事象の生起を完全には観測できない.そのため,事象の生起が部分観測の場合も考慮して制御パターンをスーパバイザに学習させる必要がある.本論文では,完全観測の場合において提案した手法を拡張し,部分観測環境において最悪ケースにおける評価値を最大化する制御パターンの与え方をスーパバイザに学習させる手法を提案する.部分観測環境を扱うために,射影関数と不可観測事象列の生起に対する報酬のデータベースを導入する.これらから与えられる情報をもとにスーパバイザは学習を進めていく.このときスーパバイザは,制御対象の現在の状態の推定と評価値の更新を行うことにより,最適な制御パターンの与え方を学習する.計算機実験により,部分観測環境においても最適な制御パターンをスーパバイザが学習できることを示し,提案手法の有効性を示す.
- 2011-09-01
著者
関連論文
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御 (コンカレント工学)
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御 (VLSI設計技術)
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御 (回路とシステム)
- A-12-8 強化学習に基づく最適スーパバイザ制御の一般化に関する検討(A-12.コンカレント工学,一般セッション)
- 最悪ケースを考慮した最適スーパバイザの強化学習
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- CAS2010-26 強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- 強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- 部分観測下での最悪ケースを考慮したスーパバイザの強化学習(ペトリネット,離散事象システム,一般)
- 最悪ケースを考慮した最適スーパバイザの強化学習
- 省電力を考慮した市場モデルによるメニーコアプロセッサのコア配分(組込みシステム,一般)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御 (システム数理と応用)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御 (信号処理)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御 (VLSI設計技術)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御 (回路とシステム)
- 部分観測下での最悪ケースに基づくスーパバイザの強化学習(システムと制御)
- A-12-3 調停器と強化学習による大規模離散事象システムの分散スーパバイザ制御に関する検討(A-12.システム数理と応用,一般セッション)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
- リスクとコストを考慮した離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)