誤り駆動型学習とシソーラスを用いた文書自動分類
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、誤り駆動型学習アルゴリズムWINNOWを用いたテキスト自動分類手法について述べる。WINNOW は、事例中にノイズを含む場合や分類に無関係な属性が多数存在する場合に対して、効率的に働くことが知られており、上記特徴を持つテキスト分類の問題に対して、有効に働くことが期待できる。本提案手法では、テキストを表す特徴として、単語だけでなくシソーラスによって付与される意味カテゴリーも合わせて利用する。シソーラス利用によって生じる2つの問題点、特徴空間の次元増加による過適用の問題及び多義の問題を解決する手段として、Filtering手法及び関連度に基づく多義性解消手法を提案する。RWCPテキストコーパスを用いた分類実験により、提案手法の妥当性を示す。
- 社団法人電子情報通信学会の論文
- 1997-07-25
著者
関連論文
- 文対応対訳コーパス構築環境BACCS
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 誤り駆動型学習とシソーラスを用いた文書自動分類
- 辞書と統計を用いた対訳アライメント
- 辞書と統計を用いた対訳アライメント
- 自動アライメント機能を組み込んだ対訳コーパス構築環境BACCS
- 帰納学習アルゴリズムと階層型クラスタリング手法を用いた概念シソーラスの自動構築及び更新
- 帰納学習アルゴリズムとクラスタリング手法を用いた概念シソーラスの自動構築及び洗練