WWWページの分類におけるテキストの特徴分析手法
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、従来より情報検索の分野で利用されてきた特徴ベクトルと類似度計算の手法に基づきWWWページを対象に行なった分類実験について述べる。WWWページやオフィスの雑文書等の分類整理では分類用カテゴリ特徴の訓練データの作成が問題になるが、ここでは、数多くのWWWサイトで提供されているインデックス集やリンク集等、人手で行なわれた分類の結果をカテゴリ特徴訓練データとして用い、単語、形態素、bigram等の特徴素別の分類結果や、リンク情報の利用による特徴収集等について報告する。
- 一般社団法人情報処理学会の論文
- 1997-03-21
著者
関連論文
- トップダウンなパターン解析に基づく情報抽出
- 文書中の情報を整理する情報抽出技術 (特集 電子図書館を支える技術)
- 質問応答事例検索のための談話構造の認定
- 質問応答事例検索のための談話構造の認定
- 知識資産活用のための情報抽出 (2000年情報学シンポジウム--ネットワーク型情報メディアの活用と情報を活かす新技術) -- (セッション5:情報検索・情報抽出)
- 新聞記事からの用語集作成のためのテキスト分析
- 新聞記事からの人物・企業情報の抽出
- 新聞記事からの人物・企業情報の抽出
- WWWページの分類におけるテキストの特徴分析手法