WWWページの分類におけるテキストの特徴分析手法

スポンサーリンク

概要

論文の詳細を見る
本報告では、従来より情報検索の分野で利用されてきた特徴ベクトルと類似度計算の手法に基づきWWWページを対象に行なった分類実験について述べる。WWWページやオフィスの雑文書等の分類整理では分類用カテゴリ特徴の訓練データの作成が問題になるが、ここでは、数多くのWWWサイトで提供されているインデックス集やリンク集等、人手で行なわれた分類の結果をカテゴリ特徴訓練データとして用い、単語、形態素、bigram等の特徴素別の分類結果や、リンク情報の利用による特徴収集等について報告する。
一般社団法人情報処理学会の論文
1997-03-21

著者

関連論文

スポンサーリンク