囲碁における勾配法を用いた確率関数の学習(囲碁)
スポンサーリンク
概要
- 論文の詳細を見る
囲碁の局面評価は非常に複雑であり特徴の数は膨大となる。そのため膨大なパラメータを人間が調整していく事は困難を極める.そこで本稿は機械学習のアプローチからこの問題を解決する。学習手法にはコンピュータ将棋において評価関数の学習に用いられている勾配法をコンピュータ囲碁に応用する。将棋と囲碁の学習で決定的に異なる点は,将棋では手の順序関係を学習できれば十分であったが,囲碁では確率分布を生成しなければいけないため比率まで考慮しなければいけない点にある.本稿では異なる二つの誤差関数を設計する事でこの問題を解決している.ベンチマークとして,現在世界最強の囲碁プログラムであるCrazy Stoneで用いられている学習手法である「小数化-最大化」と比較実験を行った結果,大きな性能向上を確認できた.
- 2009-03-02
著者
-
橋本 剛
北陸先端科学技術大学院大学
-
松井 利樹
株式会社KDDI研究所
-
野口 陽来
北陸先端科学技術大学院大学情報科学研究科
-
橋本 剛
松江工業高等専門学校情報工学科
-
土井 佑紀
北陸先端科学技術大学院大学
-
松井 利樹
北陸先端科学技術大学院大学
-
土井 佑紀
北陸先端科学技術大学院大学情報科学研究科
関連論文
- 囲碁における勾配法を用いた確率関数の学習(囲碁)
- 囲碁における勾配法を用いた確率関数の学習
- モンテカルロ+UCTにおける探索木のだまし構造
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- 四人将棋プログラムの基本的アルゴリズム
- ダイナミックインフォメーション将棋のエンタティンメント性
- コンピュータ将棋における指し手の順序付けによる探索効率化(ゲームプログラミング)
- 将棋終盤で発展してきた探索手法のLines of Actionへの適用(ゲームプログラミング)
- 正規型ゲームと逆型ゲームの比較
- 必至問題を解くプログラムとその評価
- 必死探索とその効率化
- モンテカルロ碁で用いるパターンの大きさに関する考察
- F18 内分泌撹乱物質による母乳汚染の理論的考察
- 進行度を用いたボナンザメソッドの提案
- コンピュータ将棋(ゲームとコンピュータ)
- コンピュータ将棋におけるキラー手
- ゲーム木探索における2つの局面表の交互使用
- 指し手の統計情報に基づく探索の効率化
- 中将棋と詰みの概念における将棋種の変遷に対する考察
- 完全情報ゲームと不完全情報ゲームの戦略的架け橋 : 麻雀を題材として
- 不確定性多人数ゲームのプログラミング : 四人制チャツランガを題材として
- チェスライクゲームにおける普遍的指標
- あから2010勝利への道 : 3.清水女流王将対策と序盤戦術
- マルチエージェント型マルチプレイヤーゲームにおける探索手法に関する研究
- 局面評価関数を使う新たなUCT探索法の提案とオセロによる評価
- F-044 コンピュータ将棋機械学習における高頻度な駒組み合わせ抽出法の研究(F分野:人工知能・ゲーム)
- F-045 カタンの開拓者たちにおけるモンテカルロ木探索を用いたAIの改良(F分野:人工知能・ゲーム)
- F-043 熟練プレイヤーレベルを目指す弾幕シューティングAIの開発(F分野:人工知能・ゲーム)
- F-046 RoboCupサッカー小型サイズロボットリーグにおける協調指向AIフレームワークの構築(F分野:人工知能・ゲーム)