モンテカルロ+UCTにおける探索木のだまし構造
スポンサーリンク
概要
- 論文の詳細を見る
マルチアームバンディット問題 (MAB) を対象に発展した UCB 戦略は,探索と収穫のジレンマに対する一つの有力な回答である.近年,UCB 戦略をゲームの木探索に応用した UCT が盛んに研究され,モンテカルロ法と組み合わせた囲碁プログラムが登場している.しかし,報酬を得られる確率が静的な MAB と異なり,minmax 原理が支配する二人ゲームでは UCB 値に基づく探索が非効率的である可能性もある.本稿では,囲碁において UCT が好ましくない挙動をしうることを指摘し,その本質を抜き出してベンチマーク化する.
- 2010-06-18
著者
-
池田 心
北陸先端科学技術大学院大学情報科学研究科
-
橋本 隼一
北陸先端科学技術大学院大学
-
土井 佑紀
北陸先端科学技術大学院大学
-
池田 心
北陸先端科学技術大学院大学
-
土井 佑紀
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 京都大学教育用コンピュータシステムの利用者管理
- 新学習指導要領における情報モラル教育の位置づけと情報倫理教材(インターネットと情報教育-シングルセッション,インターネットと情報倫理教育,一般)
- 新学習指導要領における情報モラル教育の位置づけと情報倫理教材(インターネットと情報倫理教育-シングルセッション,インターネットと情報倫理教育,一般)
- 囲碁における勾配法を用いた確率関数の学習(囲碁)
- 囲碁における勾配法を用いた確率関数の学習
- 情報教育に関する大学新入生の状況変化-京都大学新入生アンケートの結果から
- ハイブリッドGAによるインスタンスベース政策学習 : SLIPの提案と評価
- 多目的関数最適化におけるGAと局所探索の組み合わせ : GA then LS の推奨
- 多目的関数最適化のための局所探索 : パレート降下法
- 初級プログラミングについての課外学習機会の提供
- モンテカルロ+UCTにおける探索木のだまし構造
- 新学習指導要領における情報モラル教育の位置づけと情報倫理教材(インターネットと情報教育-シングルセッション,インターネットと情報倫理教育,一般)
- 交通信号における社会規範創発への進化型エージェントアプローチ
- 教科「情報」の履修状況と情報リテラシに関する平成20年度新入生アンケートの結果について(記念講演,教育システム)
- 教科「情報」の履修状況と情報リテラシに関する平成20年度新入生アンケートの結果について
- Virtual Machineを活用した大規模教育用計算機システムの構築技術と考察(システム構築・運用技術, オープンソース時代の分散システム/インターネットの構築・運用技術)
- 教育用計算機システムの利用の動向について
- モンテカルロ碁で用いるパターンの大きさに関する考察
- α-domination 戦略に基づく分散強化学習と資源共有問題への応用
- 独立制約充足による最適化と送水制御への適用
- 生得分離モデルを用いたGAとJSPへの適用
- GAの探索におけるUV現象とUV構造仮説
- 履歴を用いた状態評価関数の序列推定
- UV構造仮説に基づくGAの設計とJSPへの適用
- 進行度を用いたボナンザメソッドの提案
- コンピュータ将棋におけるキラー手
- 4人版リバーシYonin
- 予測市場シミュレーションのためのエージェント群構成法
- 確率的最適化を用いた絵画的迷路生成
- 落下型パズルゲームの定石形配置法とぷよぷよへの適用
- プレイヤの効用を学習し行動選択するチームメイトAIの構成
- 楽しませる囲碁・将棋プログラミング(娯楽のOR)
- インスタンスベースの政策表現と進化計算による最適化(多点探索型機械学習の新展開)