多人数不完全情報ゲームのモンテカルロ木探索における推定の効果
スポンサーリンク
概要
- 論文の詳細を見る
不完全情報多人数ゲームのうち大貧民を含むトリック型ゲームでは冒頭の偶然手番で選ばれたカードの分配状態が明らかでなく、ゲームの進展に応じて徐々に情報が明らかになる。このようなゲームを対象としてモンテカルロ木探索によって最良な決定をしようとするとき未知情報である相手情報すなわち状態の推定は重要と考えられる。しかし実験的には状態の推定を行わないときと比較して、その効果はあまり大きな寄与がみとめられなかった。本論文ではこの事実にもとづいて、不完全情報ゲームの状態推定が、多人数ゲームのモンテカルロ木探索において果たす効果について、状態の集合を最適な着手による同値類に分けることで、定性的な分析を行った。とりうる状態数が選択可能な合法手に対して非常に大きいため、複数の状態を仮定して探索するモンテカルロ木探索にたいして、状態の確定的な推定はあまり重要ではないことを示した。
- 2011-11-24
著者
-
西野 哲朗
電通大
-
西野 順二
電気通信大学電気通信学部
-
西野 順二
電気通信大学システム工学科
-
西野 哲朗
電気通信大学 電気通信学部 情報通信工学科 情報メディア工学講座
-
西野 順二
電気通信大学
-
西野 順二
福井大学 知能システム工学科
-
西野 哲朗
電気通信大学 先進アルゴリズム研究ステーション
-
西野 哲朗
電気通信大学
-
西野 順二
福井大学工学部知能システム工学科
-
西野 哲朗
電気通信大学先進アルゴリズム研究ステーション
関連論文
- M.Nakahara and T.Ohmi, QUANTUM COMPUTING;From Linear Algebra to Physical Realizations, CRC Press, USA, 2008, xvi+421p, 24×16cm, $79.95, [大学院向], ISBN978-0-7503-0983-7
- 直方体分割の24次格子グラフ表現とその応用 (アルゴリズムと計算機科学の数理的基盤とその応用)
- ロボカップサッカーとジャグリング : 計算される日常
- 第2回UECコンピュータ大貧民大会(UECda-2007)の報告
- 進化的計算によるケーブル配線経路計画問題の解法
- インターナルクロックモデルに基づくロボット制御法の実現
- インターナルクロックモデルに基づくロボット制御法の実現(セッション1)
- 小脳顆粒層をモデル化したスパイキングネットワークの研究 : NMDA受容体を介した同期発火状態と時間表現状態の遷移(バイオサイバネティックス,ニューロコンピューティング)
- 小脳顆粒層のスパイキングネットワークモデルにおける状態遷移とタイミングメカニズムに関する研究(機械学習,一般)
- 自由再生実験における記憶の神経回路モデルについて(セッション2)
- E-075 K-means法を用いたジュウシマツの歌の音素分類に関する研究(E分野:自然言語・音声・音楽)
- E-074 可変長Nグラムモデルを用いたジュウシマツの歌構造の解析に関する研究(E分野:自然言語・音声・音楽)
- UECソフトウェア・リポジトリと実践的ソフトウェア開発教育(知的財産,一般)
- 局所移動補正によるDSA画像のレジストレーションの改善
- 頭勁部DSA画像における局所移動量を用いたレジストレーション法
- 量子計算量理論(システムソサイエティ論文賞受賞記念講演)
- NMR量子計算によるNP完全問題と因数分解の解法(量子計算)
- 衝突問題に対する量子アルゴリズムにおけるソーティング方法の選択について(量子計算)
- コンピュータ大貧民(思考ゲーム)
- 第3回UECコンピュータ大貧民大会(UECda-2008)の報告(大会報告)
- クラスター状態を用いた量子計算への新たなアプローチ
- GPGPUによるGroverのアルゴリズムのシミュレーション
- ノイズ環境化におけるGroverのアルゴリズムのシミュレーション
- 第1回UECコンピュータ大貧民大会(UECda-2006)の実施報告
- 第1回UECコンピュータ大貧民大会(UECda-2O06)の報告
- 量子計算量の下界の評価手法(新世代の計算限界-その解明と打破-招待解説論文)
- 量子計算量理論の最近の展開について(電子デバイス, 一般)
- Bulk量子計算モデル上におけるGroverのアルゴリズムの繰返し回数について
- 物理的実現可能性に優れたNMR量子探索アルゴリズム(計算理論)
- 最適配線経路選定問題に対する階層型遺伝的アルゴリズムの構成
- 多重選択ナップザック問題の多値対立遺伝子コーディングにおける世代スキーマの利用
- 5L-7 階層的突然変異によるGAのMCKPへの応用における収束の改善
- DSA画像を対象とした位置合わせ処理法の検討
- 小脳スパイキングネットワークモデルにおける条件刺激強度依存性タイミング制御
- バーチャルサッカーで人工プレイヤと協働する人間ミッドフィールダーの行動(セッション(3) : エンタテインメントコンピューティング(1))
- サッカー協調プレイの強化学習のための状態縮約(セッション(3) : エンタテインメントコンピューティング(1))
- RoboCupサッカーにおける動作による意思伝達(セッション(3) : エンタテインメントコンピューティング(1))
- RoboCupサッカーにおける動作による意思伝達 (人工知能基礎論研究会(第55回)特集「エンタテイメントコンピューティングの基礎と応用」および一般) -- (セッション(3)エンタテインメントコンピューティング(1))
- スキルトロニクスゲーム(各種ゲーム)
- ファジィ意志決定によるサッカーのパスポイント決定 : ファジィ判断を用いた RoboCup サッカーエージェント
- サッカーエージェントにおける基本行動の獲得
- RoboCupにおけるサッカーエージェントの設計
- 任意形状位置概念をもちいたエージェント行動規則表現
- GPGPUによる Grover のアルゴリズムの大規模シミュレーションについて
- 多人数不完全情報ゲームの簡略化評価値による探索を用いた終盤データベースの構築
- RoboCupサッカーにおける戦略混合比の分析
- 4J-4 サッカーエージェントの協調知識表現
- 2M-2 自律的エージェントモデルによる協調的集団行動
- 小脳スパイキングネットワークモデルにおける条件刺激強度依存性タイミング制御
- NMR量子計算機を用いた効率的探索アルゴリズムの設計について
- 衝突問題に対する量子アルゴリズムにおけるソーティング方法の選択について
- NMR量子コンピュータ上における効率的量子探索アルゴリズム
- 4C-6 複数のプログラミング言語におけるオブジェクト指向プログラミングモデルの提案
- PCクラスタを利用したDSAレジストレーションの並列化の検討
- 逐次近似法によるDSA画像の画質改善
- 4M-7 DSA画像における逐次近似法を利用した画質の改善
- GPGPUによる Grover のアルゴリズムの大規模シミュレーションについて
- 幼児の言語獲得における「動詞-島」段階のニューロイダルネットによるモデル化(抽出・言語獲得)
- FPGA上に実装した小脳ネットワークモデルにおけるタイミングメカニズムの研究(脳のモデルと生物模倣情報処理1,生物模倣情報処理,機械学習,一般)
- 日本語学習者のためのローマ字表記に基づいた片仮名語からの英単語検索の試み(研究速報)
- 多段ファジィ推論を用いた麻酔科医の血圧管理知識の表現と時系列臨床データからのGAによる獲得手法の検討
- コマンド利用の周期性に基づく個人認証手法の提案
- 遺伝的プログラミングをもちいた戦略知識の進化的獲得
- 感性構造の分析のための似顔絵作成システムの構築
- インターネットメールシステムの問題点を解決するための新しいMail Transfer Agentの提案
- 麻酔時の血圧管理におけるファジィ推論知識の表現
- 似顔絵生成システムにおける感性の構造
- かな漢字の特徴を利用したかな漢字手書き署名の認証手法の検討
- 量子計算と量子アルゴリズム
- 量子計算機による情報処理 (特集:量子効果を用いた通信・処理技術)
- 量子論理回路深さ最小化問題のクリーク問題への還元(クリーク問題と応用)
- 任意形状位置概念をもちいたエージェント行動規則表現
- 終盤データベースを用いた多人数不完全情報ゲームプレイヤモデル
- 新しい計算パラダイム
- 節点重み最大クリーク抽出アルゴリズムと実験的評価
- 節点重み最大クリーク抽出に基づく量子回路の深さ最小化 (計算機科学基礎理論の新展開)
- 節点重み最大クリーク抽出アルゴリズム (計算機科学基礎理論の新展開)
- 量子情報科学の未来--情報セキュリティの観点から (特集 量子情報科学の新時代--量子へと向かう情報とは何か?)
- 量子ゲーム理論 (特集 量子情報科学の新時代--量子へと向かう情報とは何か?)
- 量子セルオートマトンに基づく画像圧縮のための画像変換アルゴリズム (計算機科学とアルゴリズムの数理的基礎とその応用)
- 実時間最終状態受理式決定性限定1カウンタ変換器の多項式時間等価性判定アルゴリズム (計算機科学とアルゴリズムの数理的基礎とその応用)
- 最大クリーク問題の多項式時間的可解性について (計算機科学とアルゴリズムの数理的基礎とその応用)
- UMLパッケージ図に対するグラフ文法とその応用
- コンピュータ大貧民に対するモンテカルロ法の適用
- 大貧民における相手手札推定
- Liquid state machineを用いたタイミング制御システムの研究
- 多人数不完全情報ゲームのモンテカルロ木探索における推定の効果
- 多人数不完全情報ゲームのモンテカルロ木探索における推定の効果
- B Methodにおける高信頼ソフトウェア部品自動生成
- 最大クリーク問題の多項式時間的可解性の更なる改良結果
- 最大クリーク問題の多項式時間的可解性の更なる改良結果(情報・システム基礎)
- 最大クリーク問題の多項式時間的可解性の拡張
- 8次格子モデルによる表の行/列操作 (アルゴリズムと計算理論の新展開)
- 最大クリーク問題の多項式時間的可解性の拡張(情報・システム基礎)
- 量子計算量の理論 (特集 量子情報技術--最前線からの展望)
- 量子コンピュータ (特集 コミュニケーションの現在・2003) -- (コンピュータ科学の現在)
- コンピュータ大貧民(娯楽のOR)
- 格助詞によるクラスタリングを用いた分布類似度計算の高速化
- ソースコードモジュール重要度算出法の提案 (理論計算機科学の新展開)
- 最大クリーク問題の多項式時間的可解性の拡張の改良