特徴の出現回数に応じた<i>L</i><sub>1</sub>正則化を実現する教師ありオンライン学習手法
スポンサーリンク
概要
- 論文の詳細を見る
オンライン学習 (逐次学習) とは,訓練データを 1 つ受け取るたびに逐次的に学習を行う手法であり,大規模な訓練集合からの学習が効率化される.L1 正則化とは,学習上不要なパラメータを零化する手法で,学習の高速化やメモリ効率の改善が期待される.2009 年に提案された FOBOS7) は上記の二手法を組み合わせた,教師あり学習のための L1 正則化付きオンライン学習手法である.しかし FOBOS では,特徴の出現回数が不均一な訓練集合では,低頻度の特徴が排除されやすい性質を持つ.FOBOS では各特徴の出現頻度やパラメータの累積更新幅とは無関係に全特徴に共通の零化を施すためである.しかし既存の L1 正則化付きオンライン学習アルゴリズムでは,この性質は分析されてこなかった.本稿では,特徴の出現回数の情報を用いた L1 正則化を導入した教師あり学習のためのオンライン学習手法 (HF-FOBOS) を提案する.さらに,HF-FOBOS は既存手法と同様の計算コスト.収束速度でパラメータの累積更新幅に応じた L1 正則化を実現する学習手法である事を確認する.また,HF-FOBOS と FOBOS に対して実問題に基づく実験を行い,出現頻度を利用した L1 正則化が精度向上へ寄与することを示した.
- 2011-02-28
著者
関連論文
- 多クラス識別問題におけるPassive-Aggressiveアルゴリズムの効率的厳密解法(自然言語処理,知識獲得,情報爆発論文)
- 2P-8 ソーシャルブックマークにおけるスパムの検出(Webマイニング,学生セッション,データベースとメディア)
- PAアルゴリズムにおけるラベルなしデータからの学習
- サポートクラスによるPassive-Aggressiveアルゴリズムの多クラス化 (言語理解とコミュニケーション)
- 自然言語処理(NL)研究会(研究会千夜一夜)
- ドキュメントへのインフォメーションハイディング(インフォメーションハイディング)
- 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング
- ユーザが知らない語を予測する読解支援システムSocialDictとそのリーダビリティ測定への拡張
- ユーザが知らない語を予測する読解支援システムSocialDictとそのリーダビリティ測定への拡張
- Web文書中の単語クリックログの解析から未知単語を予測する語義注釈システム
- 出現頻度と連接頻度に基づく専門用語抽出
- 出現頻度と連接頻度に基づく専門用語抽出
- E-018 世界の多言語ニュースの収集と分類(E分野:自然言語・音声・音楽)
- ユーザが知らない語を予測する読解支援システム SocialDict とそのリーダビリティ測定への拡張
- en. newikipedia. org : 英語版 Wikipedia 中のユーザが知らない英単語を予測するユーザ参加型読解支援システム
- 4W-6 Word Alignment Based Bilingual Terminology Extraction from a Chinese-Japanese Parallel Corpus
- 3W-7 多クラス識別問題におけるオンライン学習のための厳密なPAアルゴリズム(学習(2),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5D-7 Web文書中のユーザが知らない語を予測する読解支援システム(自然言語処理(2),一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- Web 文書中の単語クリックログの解析から未知単語を予測する語義注釈システム
- サポートクラスによる Passive-Aggressive アルゴリズムの多クラス化
- サポートクラスによるPassive-Aggressiveアルゴリズムの多クラス化
- SPAアルゴリズムの半教師あり学習への応用
- SPAアルゴリズムの半教師あり学習への応用
- D-015 ソーシャルブックマークにおけるスパム検出のための特徴とその評価(データベース,一般論文)
- 論文特集「Webコンテンツの知的処理」まえがき
- 1B1-3 時系列テキスト集合からの社会的関心の分析(1B1 OS:共創・価値創成)
- 特徴の出現回数に応じたL1正則化を実現する教師ありオンライン学習手法
- 複数新聞記事サイトの横断検索とトピックのドリフト支援システム
- 量子アニーリングによる無限混合モデルの並列最適化(機械学習とその応用)
- OS-20 プライバシー保護データマイニング(オーガナイズドセッション報告,2012年度人工知能学会全国大会(第26回))
- ロックアップ期間による制約を考慮した確率的バンディット問題
- 滞在場所のk-匿名化と濡れ衣
- ロックアップ期間による制約を考慮した確率的バンディット問題
- OS-06 情報の保護と中立性に配慮したデータ分析(オーガナイズドセッション,2013年度人工知能学会全国大会(第27回))
- ソーシャルメディアからの地域固有表現の抽出(地域情報&ソーシヤルメデイア,第4回集合知シンポジウム)