文ベクトル集合モデルによるテキスト処理 (II)
スポンサーリンク
概要
- 論文の詳細を見る
筆者は先にベクトル空間モデルを改善した新しいモデルとして文ベクトル集合モデル(SVSM)を提案した。SVSMは文書を文ベクトルの集合で表現するもので、その単語-文行列に対して特異値分解を施すことにより文ベクトル集合を互いに直交する固有文で展開する。固有文は文書固有に決まるもので、文書固有の概念とエネルギーにより定義される。前報において、SVSMの応用として、文書間類似度、文の重要度、文間の関連度について新しい尺度を提案した。本報告においては、文の重要度について更に議論を進めるとともに、新しく単語や句の重要度について文書の概念との関係に基づく新しい尺度を提案する。さらに、文の重要度、単語重要度及び文間関連度について簡単なシミュレーションを通じ妥当性の検証を行う。
- 一般社団法人情報処理学会の論文
- 2001-05-31
著者
関連論文
- 共通性分析による階層的文書クラスタリングと話題抽出(情報抽出・データマイニング)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング,機械学習)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 多文書間の共通性分析による文書クラスタリング
- 多文書間の共通性の分析
- トピック差分因子分析法による文書間の相違性の評価
- トピック差分因子分析法による文書間の相違性の評価
- 文書集合間の差異検出法と文書分類への応用
- 文ベクトル集合モデルによるテキスト処理 (II)
- ブーリアンクエリのベクトル展開
- 文ベクトル集合モデルによるテキスト処理