ロックアップ期間による制約を考慮した確率的バンディット問題
スポンサーリンク
概要
- 論文の詳細を見る
バンディット問題は,複数のアーム(選択肢)から最も報酬の高いものを探す問題であり,探索と活用のトレードオフの代表的なモデルの1つである.近年において,情報推薦,最適経路探索,最適化,モデル選択などの分野への応用を動機として,バンディット問題は機械学習やオペレーション・リサーチの分野において注目を浴びている.本研究はロックアップ期間(選択するアームを変更できない期間)の制約を考慮したバンディット問題を提案し,どのような方策をとればよいかを調べる.既存の多くの有益なアルゴリズムがロックアップ期間を含めた場合に自然に拡張可能であることを示し,そのregret(性能)を評価する.このregretがロックアップ期間の最大の大きさに依存することを示す.さらに,ロックアップ期間が大きい場合にregretを減らすことができるBalancing and Recommendation(BaR)メタアルゴリズムを提案する.また,計算機実験の結果を示し,理論的な結果と比較し考察する.
- 2013-12-27
著者
-
中川 裕志
東京大学
-
佐藤 一誠
東京大学
-
佐藤 一誠
東京大学大学院情報理工学系研究科
-
小宮山 純平
東京大学
-
中川 裕志
東京大学情報基盤センター図書館電子化研究部門
-
中川 裕志
東京大学 情報基盤センター
-
中川 裕志
東京大学情報基盤センタ
関連論文
- テキストマイニングの活用(データマイニングの活用)
- 多クラス識別問題におけるPassive-Aggressiveアルゴリズムの効率的厳密解法(自然言語処理,知識獲得,情報爆発論文)
- 2P-8 ソーシャルブックマークにおけるスパムの検出(Webマイニング,学生セッション,データベースとメディア)
- 同義語辞書作成支援システム
- Word 2003 XML文書への情報ハイディングシステム
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- 25aQL-9 量子アニーリング法を用いた変分ベイズ推定(情報統計力学,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- HTMLの表形式データの構造認識と携帯端末表示への応用
- HTMLの表形式データの変換と携帯端末表示への応用
- 単語類似度ネットワークを通じた自動同義語獲得(語彙・固有表現・同義語)
- 中文版「言選Web」の評価(Webからの知識発見とネット応用)
- 自然言語処理(NL)研究会(研究会千夜一夜)
- 係り受けの2部グラフと共起関係を利用した同義表現抽出(抽出(2))
- 出現頻度と連接頻度に基づく専門用語抽出
- E-004 トピッククラスタを利用した協調フィルタリングに基づくWeb情報推薦システム(自然言語・音声・音楽,一般論文)
- 改行位置を利用したテキストステガノグラフィ(セキュリティと社会)(プライバシを保護するコンピュータセキュリティ技術)
- ドキュメントへのインフォメーションハイディング(インフォメーションハイディング)
- 中文版「言選Web」の評価(Webからの知識発見とネット応用)
- 文字列検索に基づく同義語・類義語抽出ツールとその性能評価
- 文字列検索に基づく同義語・類義語抽出ツールとその性能評価
- 図書館における自動レファレンスサービスシステムの実現 : Web上の二次情報と図書館の一次情報の統合(セッション1:文化・知的財産情報の統合と管理,学生チャレンジ特集)
- 図書館における自動レファレンスサービスシステムの実現 : Web上の二次情報と図書館の一次情報の統合(セッション1:文化・知的財産情報の統合と管理,学生チャレンジ特集)
- 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング
- 機械学習を用いた Web 表情報の例示検索方式とその評価
- 単語類似度ネットワークを通じた自動同義語獲得(語彙・固有表現・同義語)
- 4J-4 UT-Kiwi : 検索支援としてのテキストマイニングシステム(情報爆発時代におけるデータマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- D-5-8 Web表情報の例示検索方式とその評価(D-5. 言語理解とコミュニケーション,一般セッション)
- E-013 数値による新聞記事テキストマイニングシステムの提案(E分野:自然言語・音声・音楽)
- D-046 Web上の表情報を対象とした例示検索 : 表の構造的特徴の利用(D分野:データベース)
- 文脈情報による同義語辞書作成支援ツール(語彙・概念の獲得と同義語)
- D_049 機械学習を用いたWeb上の表情報の例示検索方式(D分野:データベース)
- 専門用語抽出方法のテストコレクション依存性(抽出)
- 語彙空間の構造に基づく専門用語抽出(抽出(2))
- 国立国会図書館リサーチ・ナビにおけるテーマグラフの生成
- ユーザが知らない語を予測する読解支援システムSocialDictとそのリーダビリティ測定への拡張
- ユーザが知らない語を予測する読解支援システムSocialDictとそのリーダビリティ測定への拡張
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- Web文書中の単語クリックログの解析から未知単語を予測する語義注釈システム
- ポスト電子図書館 : 東京大学情報基盤センター図書館電子化研究部門のスタンス(図書館生き残り作戦)
- Latent Dirichlet Allocationにおける決定論的オンラインベイズ学習
- Web上の人名検索結果の同姓同名問題における二段階クラスタリングを用いた再現率向上
- Web上の人名検索結果の同姓同名問題における二段階クラスタリングを用いた再現率向上
- 出現頻度と連接頻度に基づく専門用語抽出
- 出現頻度と連接頻度に基づく専門用語抽出
- 意味保存型の情報ハイディング : 日本語文書への適用
- 1S-6 日中英ニュース記事比較のための収集と検索(情報検索・評価分析,学生セッション,人工知能と認知科学)
- D-5-10 Web情報推薦システムにおけるトピック分類クラスタの結合と分割(D-5. 言語理解とコミュニケーション,一般セッション)
- E-018 世界の多言語ニュースの収集と分類(E分野:自然言語・音声・音楽)
- D-031 Bloggerの嗜好を利用した協調フィルタリングと内容類似性によるWeb情報推薦システムのためのクラスタリング手法の検討(D分野:データベース)
- 半構造データマイニング(semi-structured date mining)
- 自動レファレンスサービスにむけて(レファレンス再考)
- 6ZC-1 半教師有り学習に基づくWeb上の人物クラスタリングシステム(情報爆発時代におけるWebパーティカル検索,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- ユーザが知らない語を予測する読解支援システム SocialDict とそのリーダビリティ測定への拡張
- en. newikipedia. org : 英語版 Wikipedia 中のユーザが知らない英単語を予測するユーザ参加型読解支援システム
- 4W-6 Word Alignment Based Bilingual Terminology Extraction from a Chinese-Japanese Parallel Corpus
- 3W-7 多クラス識別問題におけるオンライン学習のための厳密なPAアルゴリズム(学習(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5D-7 Web文書中のユーザが知らない語を予測する読解支援システム(自然言語処理(2),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- Web 文書中の単語クリックログの解析から未知単語を予測する語義注釈システム
- サポートクラスによる Passive-Aggressive アルゴリズムの多クラス化
- サポートクラスによるPassive-Aggressiveアルゴリズムの多クラス化
- 階層Pitman-Yorトピックモデル(一般講演(学習の理論),機械学習とその応用)
- Succinct semi-structured data mining based on FREQT
- SPAアルゴリズムの半教師あり学習への応用
- SPAアルゴリズムの半教師あり学習への応用
- Latent Dirichlet Allocation における決定論的オンラインベイズ学習
- 無限混合Dirichletトピックモデル (「学習」および一般発表)
- Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes Inferenceの適用
- Dirichlet Process Unigram Mixture Modelに対するCollapsed Variational Bayes inferenceの適用(セッション2)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理,夏のデータベースワークショップDBWS 2006)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案(言語処理)
- 係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案
- D-015 ソーシャルブックマークにおけるスパム検出のための特徴とその評価(データベース,一般論文)
- 論文特集「Webコンテンツの知的処理」まえがき
- 1B1-3 時系列テキスト集合からの社会的関心の分析(1B1 OS:共創・価値創成)
- 24aTP-9 祖視化されたタンパク質分子モデルのフォールディングランドスケープ(保存系,その他の系,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- 特徴の出現回数に応じたL1正則化を実現する教師ありオンライン学習手法
- 東京大学情報基盤センター学術情報研究部門の活動紹介(ラボラトリーズ)
- 複数新聞記事サイトの横断検索とトピックのドリフト支援システム
- 量子アニーリングによる無限混合モデルの並列最適化(機械学習とその応用)
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- ソーシャルメディア上の位置情報付きテキストを利用した行動分析
- Twitterを用いた電車遅延の自動通知
- Twitterを用いた電車遅延の自動通知
- OS-20 プライバシー保護データマイニング(オーガナイズドセッション報告,2012年度人工知能学会全国大会(第26回))
- ロックアップ期間による制約を考慮した確率的バンディット問題
- ベイズ推定を用いた指数忘却型自己回帰モデルによるトレンド,季節性を含むデータの予測(2013年1月30日版)
- Analysis of Long-term Market Trend by Text-Mining of News Articles
- 滞在場所のk-匿名化と濡れ衣
- ロックアップ期間による制約を考慮した確率的バンディット問題
- 特徴の出現回数に応じたL₁正則化を実現する教師ありオンライン学習手法 (数理モデル化と応用 Vol.4 No.3)
- 3次元Haar特徴量を用いたハンドジェスチャー認識
- OS-06 情報の保護と中立性に配慮したデータ分析(オーガナイズドセッション,2013年度人工知能学会全国大会(第27回))
- ソーシャルメディアからの地域固有表現の抽出(地域情報&ソーシヤルメデイア,第4回集合知シンポジウム)
- ダイバージェンス最小化原理を利用した線形分類器のロバスト分散学習
- 滞在場所のk-匿名化法
- 匿名化の実社会での利用に向けての技術課題
- マルチタスク学習と誘因両立性
- ビッグデータ利用における個人データ保護における課題 (技術と社会・倫理)