部分空間類別法を適用した文書のフィルタリング手法の検討
スポンサーリンク
概要
- 論文の詳細を見る
文書の構造に制約を設けない代表的なフィルタリングアプローチにベクトル空間モデルによる手法が挙げられる。文書は構成する語をベクトルの各要素に割り当てた特徴ベクトル空間で類似度によって統計的に選別される。従来では, 類似度の大きい順に文書がランク付けされ, 上位からの文書数やあらかじめ決めたしきい値を通して関心ありとされる方から一面的にフィルタリングされる。ここに従来のフィルタリングは必要とされる情報から順にとるだけで, 不必要な情報をとらないとするノイズの除去を直接的に考慮していない問題がある。本論文では利用者の関心事項を関心ありとなしの両面から把握することとし, フィルタリングはその二つのカテゴリーの類別問題であるととらえ, パターン類別の考え方に基づくフィルタリング手法を提案する。パターン認識手法として知られる部分空間類別法を適用した本手法は, 語の共起関係が導入された高精度のフィルタリング手法であり, 関心事項の表現と更新を共通の機構で実現する。新聞記事を用いた実験結果を通して本手法の有効性を示した。
- 社団法人電子情報通信学会の論文
- 1998-01-25
著者
-
松永 務
株式会社nttデータ技術開発本部
-
松永 務
Nttデータ通信(株)マルチメディア技術センタ
-
松永 務
Nttデータ通信株式会社技術開発本部マルチメディア技術センタ
-
松永 務
Nttデータ通信
関連論文
- 非線形構造に着目した識別ルール抽出法(バイオインフォマティクスとパターン認識)
- D-12-55 顔画像検出におけるデータ採取地の影響について
- D-12-45 非線形構造に着目した識別ルール抽出法
- D-12-44 区分線型構造に着目した識別ルール抽出法
- 顔画像認識におけるデータ採取地の影響について
- クラスタリングによる遺伝子解析 : 遺伝子型の自動分類
- パターン分類のための統計的機械学習と遺伝子のデータマイニングへの応用に関する研究(学習と発見,人工知能分野における博士論文)
- クラスタリングによる遺伝子解析 : 遺伝子型の自動分類
- 属性抽出に基づく結果解釈を目的としたクラスタリング手法の検討(一般セッション(1))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
- 極大クリーク全列挙アルゴリズムを用いた企業コミュニティ理解
- 極大クリーク全列挙アルゴリズムを用いた企業コミュニティ理解
- 単語の重要度評価基準の検討と医療関連文書への適用評価
- WWW上の電子新聞における記事ナビゲーションシステムの実現
- テキストマイニングのためのドメイン別単語辞書の構築方法
- テキストマイニングのためのドメイン別単語辞書の構築方法
- 相補的な素性選択基準の関係を考慮した文書分類のための素性選択方式
- クリークを用いた企業間関係の構造分析
- 部分空間を導入したランキング方式の企業評価への応用
- 情報間参照構造に基づく関係性解析による疾患関連遺伝子の探索(データマイニング)
- 部分空間比較による変量選択法(テーマセッション(2))(データマイニングとパターン認識・メディア理解)
- 大規模知識構造化のための知識表現モデルと遺伝子機能解析への応用(画像処理,画像パターン認識)
- 部分空間類別法を適用した文書のフィルタリング手法の検討
- 線形識別器における学習曲線の実験的検討
- 最適化手法を用いた認識辞書の学習方法
- 沖縄県の離島人口に現れるべき乗則
- テキストマイニングのためのドメイン別単語辞書の構築方法 (バイオ情報学(BIO) Vol.2009-BIO-19)
- テキストマイニングのためのドメイン別単語辞書の構築方法 (数理モデル化と問題解決(MPS) Vol.2009-MPS-76)