重み付きデータのNormalized Cuts(データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
クラスタリングの一手法にspectral clusteringと呼ばれる手法がある.この手法は,固有値分解を行うなど線形代数的アプローチを採用している点が特徴的である.spectral clusteringの代表的な手法にNormalized Cutsがある.従来のNormalized Cutsは,重み付きデータを直接は扱えない.「重み」とはデータの重複度のことであり,直感的には同じデータを複数含む場合の出現回数のことである.従来のNormalized Cuts は,すべてのデータの重みが同じであることが前提となる.そこで我々はNormalized Cutsの枠組みの中で重み付きデータを扱える方法を提案する.それは重みの分だけ複製したデータを入力として,従来のNormalized Cutsを適用した場合と同一の結果が得られることを保証できる.しかも,計算量を大幅に減らすことができる.重み付きデータのデータ数をn_d,重みの分だけ複製して得られる総データ数をnとすると,固有値分解の計算量は(n_d/n)^<1.5>に抑えられる.提案法の従来法に対する修正は,二つのデータ間の類似度関数の定義を変更するだけという,わずかな修正で実現可能であることも示す.提案法を用いた実験として,2種類の実験結果を示す.従来のNormalized Cutsでこれらの実験を行うには限界があるが,提案法の導入により,扱える問題のサイズを広げることができる.
- 2007-09-01
論文 | ランダム
- ホログラム印刷
- Case of acute ileus caused by a spirurina larva
- 限りない可能性への挑戦--ITの活用と事業戦略 (特集 ネット時代のJA金融)
- Simulation of In Vivo Disslution Profiles in Consideration of Gastrointestinal Transit of Enteric-Coated S-2150 Granules
- 衛星情報海象設定支援ツールに基づく超高速船の斜追波臨界状態の判別