ファジィ環境評価ルールを用いた強化学習の提案とチェスへの応用
スポンサーリンク
概要
- 論文の詳細を見る
熟練者の技術を習得する手法として, 機械学習が研究されている.熟練者による教師データがない場合, 機械学習で用いられるエージェントは試行錯誤によって学習を進めなければならない.試行錯誤によって学習する手法として, 教師なし学習の一種である強化学習がある.しかし, 強化学習では, 状態と行動を対としたif-thenルールを用いているため, 状態と行動の組み合わが膨大になり, 大きな問題環境では学習が進まない.これらの問題に対し, ファジィ環境評価ルールにより遷移先状態の報酬見積値を計算し, 学習を進める新しい強化学習を提案する.本手法は, ファジィ環境評価, 環境シミュレータ, MinMax探索アルゴリズムから構成されており, 環境シミュレータを用いて行動集合を生成, MinMax探索アルゴリズムで行動を決定する.さらに, 提案手法をチェスに適応し, GNUチェスとの対戦をさせながら, 学習を行なった.その結果GNUチェスを上回る成績を上げることができ, 本提案手法の有効性を示すことができた.
- 2001-12-15
著者
関連論文
- 信楽焼陶器焼成炉のファジィ制御(芸術とあいまいさ)
- ヒューマンインタフェースシンポジウム2007報告
- 打楽器音楽の感性評価における近赤外分光法による酸素化ヘモグロビン変化の定性的モデル
- SD法による心理計測および近赤外分光法による生理計測にもとづく打楽器音楽の感性評価
- 対戦型ゲームのための階層型ファジィART学習システム
- 厳密線形化手法およびH^∞制御理論に基づく誘導電動機の制御
- 機械的な非線形性を考慮した誘導モータの非干渉制御
- 50年のあゆみ1957(昭32)〜2006(平18)(アイサイ50年とシステム・制御・情報)
- SOMを用いたキャッシュ・フローにもとづく倒産予測手法の提案
- SOMによる株式投資銘柄選定およびその選定銘柄を用いたファジィ推論による有リスク/無リスク資産分配法の提案
- 直感的推論による楽観-悲観評価にもとづく為替相場雰囲気の主観的可視化法
- 直感的推論による楽観-悲観評価にもとづく為替相場雰囲気の主観的可視化法
- 「最新のファジィシステム技法」の特集にあたって
- 可視化デザインのためのカラーバランスと知的色彩配置支援システムの構想
- ニューラルネットワークを用いた直感的推論による為替相場分析支援システムの構築
- ファジィ環境評価型強化学習によるはさみ将棋の戦術獲得に関する研究
- 強化学習によるRoboCupサッカーエージェントの行動獲得に関する研究
- SOMによる株式投資銘柄選定とファジィ推論による最適資産分配法の実データへの適用
- 2-116 共生進化ウイルスを用いた GA の提案とその適応的感染手法
- 2-105 自己組織化マップによる株式投資銘柄選定モデルの構築
- 1-113 感性モデルに基づく街並みの色彩計画支援システム
- ニューロ・ファジィによる無リスク/有リスク資産の投資割合の最適化
- FCM^*アルゴリズムによるギアモータの自動良否判定
- SD-1-2 ファジィクラスタリングによる霧発生予測
- ファジィクラスタリングによるギアモータの自動良否判定 (第15回ファジィシステムシンポジウム--やりまっせ!新世紀のたおやか技術 日本ファジィ学会設立10周年記念大会) -- (クラスタリング(1))
- GAによるパレタイジングにおける積荷配置の最適化
- 2-415 複数パレットを必要とするオーダーに対するパレタイジングの最適化に関する研究
- GAによるパレタイジングにおける積荷安定化のための制約条件に関する考察
- GAによるパレタイジングにおける積荷配置の最適化 (特集 知能化技術と設備管理)
- パレタイジングにおけるGAを用いた積荷安定化に関する研究
- ナーススケジューリング問題に対する共存型GAの探索効率の改善
- 意思伝達に感情を用いるエージェントシステムの構築
- 感性言語を用いたユ-ザインタフェ-ス (特集 感性と言語の情報処理--コンピュ-タによる感性とことばの表現)
- クラシファイアシステムにもとづく共進化エージェントの対戦型ゲームへの適用
- ミンコフスキーノルムに基づく多分割層ファジィ推論モデルのルール削減および陶器焼成炉モデリングへの応用
- 逐次移動窓を用いた多分割層ファジィ推論モデル
- ミンコフスキーノルムによる重み付多分割層ファジィモデルの構造学習
- ファジィ・ニューラルネットワークによる分散型簡略化ファジィルールの自動生成
- 逐次移動型多分割層を有する簡略化ファジィルールによるモデリング手法
- 遺伝的アルゴリズムによるファジィルール自動生成におけるルール並び替え手法とその効果
- 遺伝的アルゴリズムによる超楕円錐形メンバーシップ関数を用いたファジィルールの自動生成
- 遺伝的アルゴリズムと超円錐形メンバーシップ関数によるファジィルール自動生成手法の提案
- 画像処理による注視点入力システムとその応用
- 個人差や撮影環境を考慮した濃淡画像からの口唇領域の抽出
- 経験的知識を利用した概念形成モデル
- ランダムパレタイジングに対する遺伝的アルゴリズムを用いた最適化
- ファジィ環境評価型強化学習(FEERL)を用いた知識の有効利用
- ファジィ環境評価ルールを用いた強化学習の提案とチェスへの応用
- ファジィ環境評価型強化学習のLightsOutゲームへの応用と探索における迂回行動の回避
- 部分観測マフコフ決定過程における位置ベクトルを用いた強化学習手法の提案
- ファジィ環境評価ルールを用いた強化学習の提案と応用
- 部分観測マルコフ決定過程における位置ベクトルを用いた強化学習手法の提案
- ファジィ環境評価ルールを用いた強化学習の提案とチェスへの応用
- 部分観測マルコフ決定過程における位置ベクトルを用いた強化学習手法の提案
- 非均質マルチエージェントシステムにおける協調行動獲得に関する研究
- FEERL(Fuzzy Environment Evaluation Reinforcement Learning) を用いた習得済みルールの有効利用
- 知覚レベルにもとづくファジィルールを用いた知能システムの提案 (第15回ファジィシステムシンポジウム--やりまっせ!新世紀のたおやか技術 日本ファジィ学会設立10周年記念大会) -- (学習(3))
- 強化学習の探索型戦略への提案とその応用
- 直感的推論による楽観-悲観軸から見た財務分析支援システムの構築
- 工学における感性研究の紹介
- アイサイ・オープンレクチャー開催報告(「宇宙工学における力学と制御特集号」)
- GAによる倒立振子の対称性を利用したファジィ制御ルール生成
- 共生進化ウイルスを用いた進化的計算の提案
- 遺伝的アルゴリズムによるルール数削減を考慮したファジィルール自動生成手法に関する一考察
- GA戦略-QL戦術によるマルチエージェント最適配分問題に関する研究
- 統合によるルール削減手法を用いたファジィクラシファイアシステムによるファジィルール自動生成
- ファジィクラシファイアシステムにおける統合によるルール削減方法
- ニューラルネットワークを用いた顔表情に基づく共感モデルの構築
- 文法エンコード法を用いた遺伝的アルゴリズムによるニューラルネットワークの構造設計
- 悲観-楽観軸を用いた直感的推論によるチェスの盤面評価システムの構築
- ファジィニューラルネットワークによる階層化ファジィモデルの構築
- ファジィクラスタリングを用いたファジィID3と制御ルール獲得への応用
- 遺伝的アルゴリズムによるファジィルールの獲得と倒立振子への応用 (第15回ファジィシステムシンポジウム--やりまっせ!新世紀のたおやか技術 日本ファジィ学会設立10周年記念大会) -- (制御 倒立振子)
- ファジィ学習ベクトル量子化法による手書き文字認識
- 色彩バランス支援システムの開発
- ニューラルネットワークによる共感モデルの構築
- 共感モデル構築のための視聴者の情動分析
- ファジィCクォドリックシェル
- Q-Learning による倒立振子制御および連続値制御ルールの獲得への応用
- IFSA'97に参加して
- 感性情報による画像検索システムの構築
- 感性工学にもとづくハンカチデザインの評価
- lci@cs.ubc.caからの報告
- 楽観-悲観軸を用いた直感的推論による財務分析システムに関する一研究
- ID3の概念を用いた制御ルール獲得手法の提案とその応用
- ファジィ・ニューラルネットワークによるハンカチデザインのための感性評価モデル
- ファジィクラスタリングの概念に基づく意思決定支援手法の提案
- www.cs.ubc.caからの報告
- ファジィルール構造化ニューラルネットワークの陶器焼成炉温度・雰囲気制御への応用
- 改良形ファジー学習ベクトル量子化法(FLVQ2)の提案
- 陶器焼成炉のモデリングとファジィ制御
- 二段ファジィ制御法の提案と模型自動車の縦列駐車制御への応用
- 擬似同期を用いた動画共有によるビデオ視聴者の感情高揚
- SOMによる感性商品購入のためのグループ意思決定支援システムの構築
- パ-ソナルコンピュ-タによる不定積分学習のための知的CAIシステムの構築
- 言葉による形状表現とその地形への応用
- 2次元多峰性関数の人間の概念形成モデル
- 多変数関数の言葉による形状表現--言葉の定義とその真理値
- 言葉による地形デ-タの形状表現手法
- タイトル無し