Random Forestを用いた能動学習における有効なサンプル選択
スポンサーリンク
概要
- 論文の詳細を見る
能動学習は,インタラクティブに新しいサンプルを選択してラベルを付与し,学習に用いることで,より良い識別境界を求めるアプローチである.ラベルを付与するサンプル選択の際に,Vote Entropy を用いた手法では類似したサンプルが選択されるため,学習の効率が悪いという問題がある.本研究では Random Forest を用いたサンプルの密度推定を行い,密度分布の類似度を考慮したサンプルの選択法を提案する.提案手法は,類似したサンプルの選択を抑制することで,少数のサンプルによる学習の効率化が期待できる.評価実験より,従来の能動学習におけるサンプル選択法と比較し,提案手法はより少ないサンプル数で高い性能を持つ識別器の構築が可能であることを確認した.
- 2014-05-08