AdaBoostと能動学習を用いたテキスト分類
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、テキスト分類のタスクに対し、AdaBoostを用いた能動学習の手法を適用した結果を報告する。対象文書としてReutesr-21578コレクションを用いたところ、能動学習なしのAdaBoostの精度を、約1/10の正解データ量で実現できた。また、文書の表現を語の出現回数を特徴値とするベクトルから、語が出現したかどうかのbinary値を特徴値とするベクトルに変えるとにより、能動学習で観察されることのあるサンプル数の増加に伴う精度の劣化について考察した。
- 2001-11-20
著者
関連論文
- 日本語係り受け解析の線形時間アルゴリズム
- サポートベクタマシンを使った文書分類における仮想事例の利用
- 日本語単語分割を題材としたサポートベクタマシンの能動学習の実験的研究
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- AdaBoostと能動学習を用いたテキスト分類
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
- ブートストラップによる低人手でコスト日本語固有表現抽出
- 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- 有限状態変換器の誤り駆動型学習を用いた固有表現抽出
- JUMANにおける形態素文法記述の問題点に関する考察
- 利用者による調節が可能な高速日本語形態素解析