NMFとリンクベースの修正法によるピンポン型文書クラスタリング(一般セッション「分類と抽出」)

概要

論文の詳細を見る
Non-negative Matrix Factorization(NMF)は効果的な文書クラスタリング手法である。本論文ではNMFの精度をさらに高めるために、NMFとリンクベースの修正法を交互に適用するピンポン型文書クラスタリング手法を提案する。NMFをピンポン型で利用することで、効果的な文書クラスタリングが期待できるが、NMFは入力のクラスタリング結果を改善できない場合も多く、ピンポン型で利用すると悪影響も多い。ここでは、ピンポンの終了条件の設定でこの問題に対処する。具体的には、リンクベースの修正法の適用の後に、設定した評価関数の値が改善されたかどうかでピンポンの終了を判定する。もし改善されていなければ、ピンポンを終了し、前回のリンクベースの修正法を行った後の結果を最終的なクラスタリング結果とする。これによって、NMFを利用した効果的なピンポン型クラスタリングが可能となる。実験では16個の文書データセットを利用して、本手法をk-meansやNMFと比較した。基本となるNMFの結果を大きく改善できた。
2007-05-24