報酬自動調整機能を備えた強化学習法によるプラント制御技術
スポンサーリンク
概要
- 論文の詳細を見る
A control technology using Reinforcement Learning (RL) and Radial Basis Function (RBF) Network has been developed to reduce environmental load substances exhausted from power and industrial plants. This technology consists of the statistic model using RBF Network, which estimates characteristics of plants with respect to environmental load substances, and RL agent, which learns the control logic for the plants using the statistic model. In this technology, it is necessary to design an appropriate reward function given to the agent immediately according to operation conditions and control goals to control plants flexibly. Therefore, we propose an automatic reward adjusting method of RL for plant control. This method adjusts the reward function automatically using information of the statistic model obtained in its learning process. In the simulations, it is confirmed that the proposed method can adjust the reward function adaptively for several test functions, and executes robust control toward the thermal power plant considering the change of operation conditions and control goals.
- 社団法人 電気学会の論文
- 2009-07-01
著者
-
山田 昭彦
(株)日立製作所 エネルギー・環境システム研究所
-
江口 徹
(株)日立製作所 エネルギー・環境システム研究所
-
関合 孝朗
(株)日立製作所 エネルギー・環境システム研究所
-
清水 悟
(株)日立製作所 情報制御システム事業部
-
深井 雅之
(株)日立製作所 情報制御システム事業部
-
江口 徹
株式会社日立製作所 エネルギー・環境システム研究所
関連論文
- 日本の初期のコンピュータに関する考察 -阪大真空管計算機とFUJICについて-
- 報酬自動調整機能を備えた強化学習法によるプラント制御技術
- 日本におけるスイッチング理論の歴史
- 日本における第一世代・第二世代コンピュータの開発と保存状況
- 阪大真空管コンピュータについて
- 火力発電プラント向け環境負荷低減制御システム
- 遺伝アルゴリズムを応用した蓄熱型地域冷暖房プラントの最適運転計画
- ART2を利用したARTMAPにおける学習アルゴリズムの検討