多人数不完全情報ゲームのモンテカルロ木探索における推定の効果
スポンサーリンク
概要
- 論文の詳細を見る
不完全情報多人数ゲームのうち大貧民を含むトリック型ゲームでは冒頭の偶然手番で選ばれたカードの分配状態が明らかでなく、ゲームの進展に応じて徐々に情報が明らかになる。このようなゲームを対象としてモンテカルロ木探索によって最良な決定をしようとするとき未知情報である相手情報すなわち状態の推定は重要と考えられる。しかし実験的には状態の推定を行わないときと比較して、その効果はあまり大きな寄与がみとめられなかった。本論文ではこの事実にもとづいて、不完全情報ゲームの状態推定が、多人数ゲームのモンテカルロ木探索において果たす効果について、状態の集合を最適な着手による同値類に分けることで、定性的な分析を行った。とりうる状態数が選択可能な合法手に対して非常に大きいため、複数の状態を仮定して探索するモンテカルロ木探索にたいして、状態の確定的な推定はあまり重要ではないことを示した。
- 2011-11-24
著者
-
西野 哲朗
電通大
-
西野 順二
電気通信大学電気通信学部
-
西野 順二
電気通信大学システム工学科
-
西野 哲朗
電気通信大学 電気通信学部 情報通信工学科 情報メディア工学講座
-
西野 順二
電気通信大学
-
西野 順二
福井大学 知能システム工学科
-
西野 哲朗
電気通信大学 先進アルゴリズム研究ステーション
-
西野 哲朗
電気通信大学
-
西野 順二
福井大学工学部知能システム工学科
-
西野 哲朗
電気通信大学先進アルゴリズム研究ステーション
関連論文
- M.Nakahara and T.Ohmi, QUANTUM COMPUTING;From Linear Algebra to Physical Realizations, CRC Press, USA, 2008, xvi+421p, 24×16cm, $79.95, [大学院向], ISBN978-0-7503-0983-7
- 直方体分割の24次格子グラフ表現とその応用 (アルゴリズムと計算機科学の数理的基盤とその応用)
- ロボカップサッカーとジャグリング : 計算される日常
- 第2回UECコンピュータ大貧民大会(UECda-2007)の報告
- 進化的計算によるケーブル配線経路計画問題の解法
- インターナルクロックモデルに基づくロボット制御法の実現
- インターナルクロックモデルに基づくロボット制御法の実現(セッション1)
- 小脳顆粒層をモデル化したスパイキングネットワークの研究 : NMDA受容体を介した同期発火状態と時間表現状態の遷移(バイオサイバネティックス,ニューロコンピューティング)
- 小脳顆粒層のスパイキングネットワークモデルにおける状態遷移とタイミングメカニズムに関する研究(機械学習,一般)
- 自由再生実験における記憶の神経回路モデルについて(セッション2)