実例に基づく強化学習法
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes a reinforcement learning method based on an instance-based learning approach. The learning take is assumed as follows. The input on each learning cycle is a vector of real numbers, the output is a symbol selected from a Priori known finite set, and the reinforcement from environment is +1, 0 or -1 usually being 0, that is, in the manner of delayed reinforcement. The last assumption makes it difficult to apply any conventional supervised concept learning schema because the evaluation of its output is not given at every cycle. The key idea is to propagate reinforcement backward through the memorized experiences in the order of time. The learner tends to select the output which is associated with the input similar to current situation and which will likely lead to high positive reinforcement, scanning all of the past experiences stored in memory verbatim. In addition to this basic mechanism, two types of extensions are proposed. The first is to restrict the capacity of memory to avoid infinite increase of time and space complexity, replacing the oldest data by new data in each cycle. The second is to embed a feedback mechanism concerning with reliability of each memorized experience. Reliability of the experience employed to decide the output of nearly previous cycle is increased when the learner gets positive reinforcement, and is decreased when negative reinforcement. Experimental results show these learning algorithms work well for a domain of simulating adaptive behavior, and the extension methods are effective.
- 社団法人人工知能学会の論文
- 1992-07-01
著者
関連論文
- 模擬育種法による作曲支援システムの試み : 多数パートへの拡張
- Evolution of cooperation in public goods games with probabilistic participation (Theory of Biomathematics and its Applications IV)
- 人工生命と実生命の視覚レベルにおける相互作用の試み : 感情を表現する群れエージェント
- マルチエージェントシステムを用いた指示系統の構造評価 : 災実救助
- 生成的システム(Generative System)
- 模擬育種法のCGおよび音楽応用とインタフェース
- 特集「生成的システム」の掲載にあたって
- 自律的補強システムのモデル化
- 進化計算のアートへの応用
- システム・情報部門シンポジウム1999開催報告
- 対話型進化計算法の研究動向(対話型進化計算法)
- 論文特集「対話型進化計算法」にあたって
- マルチエージェント進化
- ECAL'97の報告
- 創価大学工学部情報システム学科 畝見研究室
- 進化発達系における形態の多様性へのアプローチ
- 人工生命研究のポリエージェント的側面(多主体複雑系のパラダイム)
- 進化ロボット群についての種分化分析
- 第7回知能工学部会講演会と第23回知能システムシンポジウムを開催して
- IBQL : 実例に基づくQ学習
- 人と共同作業を行う自律移動ロボット群の設計の試み-国際ファジィ工学研究所での研究事例
- 8.講演(4)「あいまいさを伴う知識を有効利用可能なプランニングアーキテクチャ」(『言いたい放題の合宿合同研究会(パート2)』ファジィ推論とエキスパート・システム 第17回研究会(第6回ワークショップ)評価問題 第7回研究会(第2回ワークショップ))
- 11.一般講演9…ファジィマッチングを用いたロボットの行動計画と制御(関東支部 第2回ワークショップ実施報告)
- 9.講演(5)「あいまいな環境における高速かつ確実な強化学習アルゴリズム」(『言いたい放題の合宿合同研究会(パート2)』ファジィ推論とエキスパート・システム 第17回研究会(第6回ワークショップ)評価問題 第7回研究会(第2回ワークショップ))
- 強化学習法とロボットへの応用
- 強化学習 (「最近の機械学習」)
- 遺伝的アルゴリズムとコンピュータグラフィクスアート (「遺伝的アルゴリズムの新しい潮流」)
- テリー・ウィノグラード,フェルナンド・フローレス(著),平賀 譲(訳) : コンピュータと認知を理解する : 人工知能の限界と新しい設計理念,産業図書.
- 人工知能とプログラミングの接点 (「知的プログラミングの基礎」)
- 代謝と環境制約を考慮した単純な発達システムの進化
- 強化学習
- 強化学習
- キャンパス情報処理ネットワ-クの運用と研究環境の拡張
- 3次元ユークリッド空間上の単純な発達システムとその進化
- 進化する自律移動ロボット群の設計に向けて
- ビデオ編集のための群れの高速描画法(ポスター展示(エンターテインメント・アニメーション),映像表現フォーラム)
- ビデオ編集のための群れの高速描画法
- 人間と協調作業をする分散ロボット(ファジィ思考によるヒューマンフレンドリシステムへの挑戦 : LIFE6年間の活動を終えて)
- 星野 力 編著 : 人現生命の夢と悩み-コンピュータの中の知能と行動の進化, 裳華房 (1994).
- 進化する成長システムのシミュレーション(人工生命)
- Lin, L.-J. : Scaling Up Reinforcament Learning for Robot Control, Proc. of 10th Int. Conf. on Machine Learning, pp.182-189 (1993).
- GAの制御への応用
- 実例に基づく強化学習法による失敗しない制御方法の学習
- 実例に基づく強化学習法
- 3次元群れ行動シミュレーションの高速アルゴリズム(ポスター(CG),映像表現・芸術科学フォーラム2013)