囲碁における勾配法を用いた確率関数の学習
スポンサーリンク
概要
- 論文の詳細を見る
囲碁の指し手を評価するには膨大な数の特徴とそれらの複雑な関係を考慮する必要がある.人手によるパラメータの調整はほぼ不可能であり機械学習が唯一の現実的なアプローチである.本稿ではコンピュータ将棋において評価関数の学習に用いられている勾配法をコンピュータ囲碁に応用する.将棋の評価関数と囲碁の評価関数では求められるものが異なる.将棋では手が正しく順序付けられれば十分であるが,囲碁ではモンテカルロシミュレーションの確率分布を生成するため,比率も適切でなくてはならない.本稿では異なる2つの誤差関数を設計することでこの問題を解決している.ベンチマークとしてBradley-TerryモデルとEloレーティングモデルを用いた学習手法(これは世界最強の囲碁プログラムの1つCrazy Stoneで用いられている)と比較した結果,大きな性能向上を確認できた.
- 2010-11-15
著者
-
橋本 剛
北陸先端科学技術大学院大学
-
松井 利樹
株式会社KDDI研究所
-
野口 陽来
北陸先端科学技術大学院大学情報科学研究科
-
土井 祐紀
北陸先端科学技術大学院大学情報科学研究科
-
橋本 剛
松江工業高等専門学校情報工学科
-
土井 佑紀
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 囲碁における勾配法を用いた確率関数の学習(囲碁)
- 囲碁における勾配法を用いた確率関数の学習
- モンテカルロ+UCTにおける探索木のだまし構造
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- 四人将棋プログラムの基本的アルゴリズム
- ダイナミックインフォメーション将棋のエンタティンメント性
- コンピュータ将棋における指し手の順序付けによる探索効率化(ゲームプログラミング)
- 将棋終盤で発展してきた探索手法のLines of Actionへの適用(ゲームプログラミング)
- 正規型ゲームと逆型ゲームの比較
- 必至問題を解くプログラムとその評価
- 必死探索とその効率化
- モンテカルロ碁で用いるパターンの大きさに関する考察
- F18 内分泌撹乱物質による母乳汚染の理論的考察
- 進行度を用いたボナンザメソッドの提案
- コンピュータ将棋(ゲームとコンピュータ)
- コンピュータ将棋におけるキラー手
- ゲーム木探索における2つの局面表の交互使用
- 指し手の統計情報に基づく探索の効率化
- 中将棋と詰みの概念における将棋種の変遷に対する考察
- 完全情報ゲームと不完全情報ゲームの戦略的架け橋 : 麻雀を題材として
- 不確定性多人数ゲームのプログラミング : 四人制チャツランガを題材として
- チェスライクゲームにおける普遍的指標
- あから2010勝利への道 : 3.清水女流王将対策と序盤戦術
- マルチエージェント型マルチプレイヤーゲームにおける探索手法に関する研究
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- F-044 コンピュータ将棋機械学習における高頻度な駒組み合わせ抽出法の研究(F分野:人工知能・ゲーム)
- F-045 カタンの開拓者たちにおけるモンテカルロ木探索を用いたAIの改良(F分野:人工知能・ゲーム)
- F-043 熟練プレイヤーレベルを目指す弾幕シューティングAIの開発(F分野:人工知能・ゲーム)
- F-046 RoboCupサッカー小型サイズロボットリーグにおける協調指向AIフレームワークの構築(F分野:人工知能・ゲーム)