べイズ法を用いたトピックモデルとクラスタリングの同時最適化
スポンサーリンク
概要
- 論文の詳細を見る
統計的クラスタリングとは与えられたサンプル集合を、解析者が用意したモデルの分布に基づいてまとめあげる手法である。一方で、画像や文書などを対象とした場合は、特徴べクトルは非常に高次元になるが、直接的な高次元データの適用は過学習や次元の呪いの問題を生じる。そのため、一般には前処理として次元圧縮の手法が用いられ、その後にクラスタリングが行なわれることが多い。しかしながら、これらの従来法では次元圧縮とクラスタリングが分離されているため相互の影響をうまく取りこむことができていない。この問題に対し本報告では、次元圧縮とクラスタリングの同時分布を与え、べイズ法によりパラメータの同時最適化をおこなうアルゴリズムを提案する。ベンチマークを用いた数値実験の結果、一部のデータセットにおいて提案手法の有効性が確かめられた。
- 2010-03-05