多文書間の共通性の分析
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、(1)複数の文書がどの程度話題を共通にするかをスコアーで表す、(2)文書間で共通する話題に対する近さに応じて各文書、各文に対してスコアーを与える、(3)複数の文書から話題の共通する文書のみを抽出する、ことを可能とする多文書間の共通性分析方法を提案する。提案手法は、「全文書からひとつづつ文を取り出して文の組み合わせると、組み合わせの数は各文書の文の数の積通り存在する。文書間の話題に関する共通度のスコアーは、文の組み合わせの各々において各文共通に存在する単語数の和、もしくは2乗和で決まる」という考えをベースとするものである。簡単な実験を通じて、提案手法の妥当性を確認し、結果を観察する。
- 一般社団法人情報処理学会の論文
- 2002-11-12
著者
関連論文
- 共通性分析による階層的文書クラスタリングと話題抽出(情報抽出・データマイニング)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング,機械学習)
- 共通性分析による文書クラスタリングの評価(分類、クラスタリング, 機械学習)(言語理解とコミュニケーション)
- 多文書間の共通性分析による文書クラスタリング
- 多文書間の共通性の分析
- トピック差分因子分析法による文書間の相違性の評価
- トピック差分因子分析法による文書間の相違性の評価
- 文書集合間の差異検出法と文書分類への応用
- 文ベクトル集合モデルによるテキスト処理 (II)
- ブーリアンクエリのベクトル展開
- 文ベクトル集合モデルによるテキスト処理