ガウス分布推定問題に対するミニマックス戦略

スポンサーリンク

概要

論文の詳細を見る
単位共分散行列を持つガウス分布のオンライン型パラメータ推定問題について考える.各時刻t=1,2,...,Tにおいて,学習者は平均値パラメータθ_tを予測し,次いで環境が事例x_tを与える.このとき,学習者は1/2(θ_t-x_t)^2の損失を被る.学習者の性能は,学習者の損失の総和と(オフラインの意味で)最適な平均値パラメータが被る損失の総和との差,すなわちリグレットによって評価する.本稿では,このプロトコルを学習者と環境によって行なわれるゲームとみなし,ラウンド数Tを既知と仮定した場合の両プレイヤーの最適戦略を与える.また,事例x_tの2ノルムの上界をXとしたとき,ゲーム値が1/2X^2(lnT-lnlnT+O(ln ln T/ln T))となることを示す.一方,θ_t=Σ^<t-1>x_q/(t-1+a)と予測する自然な学習者のリグレットは,定数aの値によらず1/2X^2(lnT-O(1))にしかならないことを示す.
2003-09-18

著者

関連論文

もっと見る

スポンサーリンク