重み付きデータのNormalized Cuts(データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
クラスタリングの一手法にspectral clusteringと呼ばれる手法がある.この手法は,固有値分解を行うなど線形代数的アプローチを採用している点が特徴的である.spectral clusteringの代表的な手法にNormalized Cutsがある.従来のNormalized Cutsは,重み付きデータを直接は扱えない.「重み」とはデータの重複度のことであり,直感的には同じデータを複数含む場合の出現回数のことである.従来のNormalized Cuts は,すべてのデータの重みが同じであることが前提となる.そこで我々はNormalized Cutsの枠組みの中で重み付きデータを扱える方法を提案する.それは重みの分だけ複製したデータを入力として,従来のNormalized Cutsを適用した場合と同一の結果が得られることを保証できる.しかも,計算量を大幅に減らすことができる.重み付きデータのデータ数をn_d,重みの分だけ複製して得られる総データ数をnとすると,固有値分解の計算量は(n_d/n)^<1.5>に抑えられる.提案法の従来法に対する修正は,二つのデータ間の類似度関数の定義を変更するだけという,わずかな修正で実現可能であることも示す.提案法を用いた実験として,2種類の実験結果を示す.従来のNormalized Cutsでこれらの実験を行うには限界があるが,提案法の導入により,扱える問題のサイズを広げることができる.
- 2007-09-01
論文 | ランダム
- 炭酸マンガンの熱分解で得たマンガン酸化物の脱硝触媒活性
- 自社株買いが株式価値に及ぼす影響に関する理論的分析--税金が存在するケース
- 繰延税金資産等の取扱いによる差異に要注意 無対価会社分割の会計ポイント (特集 導入からちょうど10年! いまどき「会社分割」活用ガイド)
- 税金裁判の動向(第103回)居住用家屋の建替え工事が中止された住宅用地に対する固定資産税の特例適用の有無[最高裁平成23.3.25判決]
- 8F-8 現代に甦る巨大古墳 : 総合的な平面図形学習の一つとして