局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
スポンサーリンク
概要
- 論文の詳細を見る
新たなゲーム木探索法としてモンテカルロ木探索,特にUCTが成功を収め広く研究されている.だが主なターゲットであるコンピュータ囲碁では局面評価関数の計算が困難であるため,パターンマッチングなどにより手の評価値を計算し強いプレイヤに近いモンテカルロシミュレーションを目指す研究がさかんに行われているものの,局面評価関数を使ったUCTの研究はこれまでほとんどなかった.本研究では新たに局面評価値をUCB値に加える手法,UCT+を提案する.初めて探索する局面で評価関数の値が高い子局面を優先的に探索するので,性能の良い評価関数があれば簡単にUCTを強くすることが期待される.実験ではすでに優れた局面評価関数が存在するオセロに提案手法を実装し評価を行った.評価関数はオープンソースで世界最強プログラムZebraのものを使った.その結果,提案手法はUCTに対し圧倒的な性能を示しその有効性が実証された.
- 2013-07-15
著者
関連論文
- 囲碁における勾配法を用いた確率関数の学習(囲碁)
- 囲碁における勾配法を用いた確率関数の学習
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- モンテカルロ碁で用いるパターンの大きさに関する考察
- 進行度を用いたボナンザメソッドの提案
- コンピュータ将棋(ゲームとコンピュータ)
- コンピュータ将棋におけるキラー手
- あから2010勝利への道 : 3.清水女流王将対策と序盤戦術
- マルチエージェント型マルチプレイヤーゲームにおける探索手法に関する研究
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- F-044 コンピュータ将棋機械学習における高頻度な駒組み合わせ抽出法の研究(F分野:人工知能・ゲーム)
- F-045 カタンの開拓者たちにおけるモンテカルロ木探索を用いたAIの改良(F分野:人工知能・ゲーム)
- F-043 熟練プレイヤーレベルを目指す弾幕シューティングAIの開発(F分野:人工知能・ゲーム)
- F-046 RoboCupサッカー小型サイズロボットリーグにおける協調指向AIフレームワークの構築(F分野:人工知能・ゲーム)