Boostingに基づく規則学習における部分候補を用いた高速化手法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,Boostingに基づく規則学習の高速化手法を提案する.Boostingとは,学習事例の重みを変化させることで,複数の弱仮説を作成し,それらを組み合わせて,最終的な仮説を作成する手法である.Boostingに基づく学習アルゴリズムは,自然言語処理,OCRなどの様々なタスクにおいて高い精度を出せることが示されている.しかし,自然言語処理タスクのように,数十万の異なる素性および学習事例から構成される学習データを扱う場合においては,学習時間が問題となる.本稿では,素性の組合せを規則として学習するBoostingに基づく学習アルゴリズムの高速化のための手法を提案する.まず,素性の組合せで表現される規則候補の生成において,重複なくかつ枝刈りに適した生成方法を提案する.次に,各Boostingラウンドにおいて素性の部分集合から生成される候補を対象に規則を学習する方法を提案する.自然言語処理タスクであるEnglish Syntactic Chunkingおよび日本語係り受け解析において本手法の評価を行った.その結果,本手法により,精度を保持したまま,100倍以上の学習時間の改善が行えることを示せた.
- 一般社団法人情報処理学会の論文
- 2009-05-15
著者
関連論文
- 大規模自然言語処理学習データのための複数弱仮説を生成する弱学習器を用いる AdaBoost 手法
- 数値属性からの例外ルール発見
- 平均的解析の拡張
- 5J-1 最小近傍法の平均的挙動の解明
- 意外性の高いルールの発見のための高速なアルゴリズム
- 重複概念の獲得が可能なクラスタリングアルゴリズムについて
- 訓練事例をガイドとする分類規則の学習
- 近傍に基づく類似事例検索の理論的解析
- 重複概念の獲得が可能なクラスタリングの一提案
- クラスタリングを用いたベイズ分類器の拡張
- K-最小近傍法におけるノイズの影響
- 企業内情報検索の高度化手法の提案と評価
- 第15回人工知能国際会議報告
- Boostingに基づく規則学習における部分候補を用いた高速化手法
- ラベルなしデータを用いた素性増強による日本語固有表現抽出方法
- Stackingの効率的な学習方法と日本語固有表現抽出での評価(抽出(1))
- Stackingの効率的な学習方法と日本語固有表現抽出での評価(抽出(1))
- カスタマーセンター支援システム
- リアルタイムSFAソリューション (特集 ユビキタス) -- (ユビキタスを支える技術)
- D_045 大規模文字列ソートのための適応的なデータ分割アルゴリズム(D分野:データベース)
- 信頼性(7)類似事例検索によるトラブル解決支援システム
- 事例の相対距離による類似度学習とその検索誤り率について
- ノイズを考慮した最小近傍法の理論的解析
- 距離情報による類似度関数の重み学習
- Boostingに基づく系列ラベリングにおける効率的規則表現方法による高速化
- 大規模空間データからの最適領域集合の効率的な発見方法
- Kura:統一的かつ宣言的記述法に基づく言い換え知識の開発環境
- Twitterからの犯罪情報抽出の可能性調査
- 類似事例検索システム : 通信ソフト故障診断問題への適用
- k-最小近傍法の平均的解析
- 最近隣法の正答率に対する理論的解析
- 重み付き最近隣法における重み学習について
- 定性的距離を用いた類似度関数の重み付けの学習
- 3.大規模半構造データからの高速な知識発見システム : 効率良い木構造バターンの発見と照合(広がる列挙の技術-列挙による問題解決アプローチ-)
- 大規模半構造データからの高速な知識発見システム : 効率良い木構造パターンの発見と照合