ガウス分布推定問題に対するミニマックス戦略
スポンサーリンク
概要
- 論文の詳細を見る
単位共分散行列を持つガウス分布のオンライン型パラメータ推定問題について考える.各時刻t=1,2,...,Tにおいて,学習者は平均値パラメータθ_tを予測し,次いで環境が事例x_tを与える.このとき,学習者は1/2(θ_t-x_t)^2の損失を被る.学習者の性能は,学習者の損失の総和と(オフラインの意味で)最適な平均値パラメータが被る損失の総和との差,すなわちリグレットによって評価する.本稿では,このプロトコルを学習者と環境によって行なわれるゲームとみなし,ラウンド数Tを既知と仮定した場合の両プレイヤーの最適戦略を与える.また,事例x_tの2ノルムの上界をXとしたとき,ゲーム値が1/2X^2(lnT-lnlnT+O(ln ln T/ln T))となることを示す.一方,θ_t=Σ^<t-1>x_q/(t-1+a)と予測する自然な学習者のリグレットは,定数aの値によらず1/2X^2(lnT-O(1))にしかならないことを示す.
- 2003-09-18
著者
-
瀧本 英二
九州大学大学院システム情報科学研究院情報理学部門
-
瀧本 英二
東北大学大学院情報科学研究科
-
Warmuth Manfred
Computer Science Department, UC Santa Cruz
-
Warmuth Manfred
Computer Science Department Uc Santa Cruz
-
Warmuth Manfred
Computer Science Department
関連論文
- オンラインランク統合問題 (アルゴリズムと計算機科学の数理的基盤とその応用)
- ブール剰余関数を計算するしきい値論理回路のサイズとエネルギー複雑度のトレードオフ
- 最簡な論理式でNPN同値類の代表のみを生成するアルゴリズム
- ある決定木のクラスに対する量子質問複雑さの下界について
- リスク情報を用いたオンライン資源分配
- 最終段ミニマックスアルゴリズム
- ガウス分布推定問題に対するミニマックス戦略
- 直交F-ホーン式の学習アルゴリズム
- ブール関数のPTF表現の複雑さについて
- ホーン式とXOR-MDNF式との関係について
- 交代数限定単調項決定リストの学習可能性
- 単調DNF式の排他的論理和の学習可能性
- オンラインオークション型資源配分問題(計算理論とアルゴリズムの新展開)
- シャノンスイッチングゲームにおけるペアリング戦略の複雑さについて
- DS-1-14 ランダム写像による非線形概念の学習の効率化に向けて(DS-1.COMP-NHC学生シンポジウム,シンポジウム)
- マージンを保存するランダム性を限定したプロジェクションとブール空間への埋め込み
- リスク情報を用いたオンライン資源分配
- 分割と併合に基づくブーステイング
- 分割と併合に基づくブースティング
- オンライン学習の学習曲線に関する研究
- LA-5 決定ダイアグラムに基づくブースティング(A. アルゴリズム・基礎)
- ランダムプロジェクションによる次元圧縮
- オンライン予測 (計算学習理論の進展と応用可能性)
- Predicting like the best pruning of a decision tree based on the on-line DP (Algorithms and Theory of Computing)
- SVMによるバイパータイトランキング学習を用いたコンピュータ将棋における評価関数の学習(IBIS2010(情報論的学習理論ワークショップ))
- オンライン予測の理論に基づく意思決定(新世代の計算限界-その解明と打破-招待解説論文)
- F-036 Online Rank Aggregation
- 対称関数を計算するユネイト回路のサイズとエネルギーのトレードオフ
- ブール剰余関数を計算するしきい値論理回路のサイズとエネルギー複雑度のトレードオフ
- しきい値回路のパターン数について (理論計算機科学の深化 : 新たな計算世界観を求めて)
- エネルギー計算量に制限のある定数段しきい値論理回路のサイズの指数下界について
- 榊原康文, 小林聡, 横森貴(著), 計算論的学習, 情報数理シリーズ(B-6), 培風館, 221p., 3,000円(税別), ISBN4-563-01496-6
- ALT'97 報告
- 路カーネルと乗算型重み更新
- 最終段ミニマックスアルゴリズム
- メトリカルタスクシステムに対する乗算型重み更新アルゴリズム
- ブール関数に対するフィルタのノイズ除去効果について
- 確率的評価値をもつゲーム木における最善手探索 (計算機科学とアルゴリズムの数理的基礎とその応用)
- Predicting like the best pruning of a decision tree
- エネルギー複雑度を用いた線形決定木の下界導出
- ブール関数のフーリエ変換とその応用
- MDL原理に基づいた決定木枝刈りアルゴリズムのシミュレーション
- 複数の予測戦略を統合する実時間予測アルゴリズム
- エネルギー複雑度を用いた線形決定木の下界導出
- 複数の予測戦略を統合する実時間予測アルゴリズム(計算理論とその応用)
- 複数の予測戦略を統合する実時間予測アルゴリズム
- 情報獲得と近似学習
- 相互情報量に基づく学習モデル
- ブールドメイン上の関数に対するサンプリングの定理
- 決定木に基づいたオンライン学習アルゴリズム
- Efficient AUC Maximization by Approximate Reduction of Ranking SVMs (情報論的学習理論と機械学習・第15回情報論的学習理論ワークショップ)
- DNF式の学習可能性
- 劣モジュラ制約下におけるオンライン予測(機械学習一般とその応用)
- ランキングSVMの近似に基づく効率的なAUC最大化(第15回情報論的学習理論ワークショップ)