トピック差分因子分析法による文書間の相違性の評価
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,2つの文書を比較した時に両文書間の概念の主要な違いを代表しうるような相違部分(特有部分)を着目文書から抽出する方法を提案する.このような特有部分抽出法には,抽出された部分は単に相違するだけでなく着目文書では重要性が高いこと,その要因が説明できること,文や語について特有性の評価値が求められることが望まれる.本報告では先に提案したトピック差分因子分析(Topic Difference Factor Analysis:TDFA)を応用し,上述の条件を満たす特有性評価法を提案する.内容が酷似した2つの文書の一方に特有な文を抽出するシミュレーション実験により提案手法の妥当性を確認した.
- 一般社団法人情報処理学会の論文
- 2002-07-15
著者
関連論文
- 共通性分析による階層的文書クラスタリングと話題抽出(情報抽出・データマイニング)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング,機械学習)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 多文書間の共通性分析による文書クラスタリング
- 多文書間の共通性の分析
- トピック差分因子分析法による文書間の相違性の評価
- トピック差分因子分析法による文書間の相違性の評価
- 文書集合間の差異検出法と文書分類への応用
- 文ベクトル集合モデルによるテキスト処理 (II)
- ブーリアンクエリのベクトル展開
- 文ベクトル集合モデルによるテキスト処理