文ベクトル集合モデルによるテキスト処理
スポンサーリンク
概要
- 論文の詳細を見る
本報告はベクトル空間モデルの改善に関するものであり、新しいモデルとして文ベクトル集合モデルを提案する。本モデルは文書を文ベクトルの集合で表現するもので、その単語-文行列に対して特異値分解を施すことにより文ベクトル集合を互いに直交する固有文で展開する。固有文は文書固有に決まるもので、文書固有の概念とエネルギーにより定義される。その結果文書の中心的な概念を定量的に把握することが可能になる。さらに、本モデルの応用として、文書間類似度、文の重要度、質問文に対する文毎の関連度について新しい尺度を提案する。文書間類似度は2文書間の全ての文の組み合わせに対する照合を、文の重要度は各文と文書の固有概念との照合を、質問文に対する文毎の関連度は質問文と固有概念の照合をもとにそれぞれ行う。
- 一般社団法人情報処理学会の論文
- 2000-11-21
著者
関連論文
- 共通性分析による階層的文書クラスタリングと話題抽出(情報抽出・データマイニング)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング,機械学習)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 多文書間の共通性分析による文書クラスタリング
- 多文書間の共通性の分析
- トピック差分因子分析法による文書間の相違性の評価
- トピック差分因子分析法による文書間の相違性の評価
- 文書集合間の差異検出法と文書分類への応用
- 文ベクトル集合モデルによるテキスト処理 (II)
- ブーリアンクエリのベクトル展開
- 文ベクトル集合モデルによるテキスト処理