重み付きデータのNormalized Cuts(データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
クラスタリングの一手法にspectral clusteringと呼ばれる手法がある.この手法は,固有値分解を行うなど線形代数的アプローチを採用している点が特徴的である.spectral clusteringの代表的な手法にNormalized Cutsがある.従来のNormalized Cutsは,重み付きデータを直接は扱えない.「重み」とはデータの重複度のことであり,直感的には同じデータを複数含む場合の出現回数のことである.従来のNormalized Cuts は,すべてのデータの重みが同じであることが前提となる.そこで我々はNormalized Cutsの枠組みの中で重み付きデータを扱える方法を提案する.それは重みの分だけ複製したデータを入力として,従来のNormalized Cutsを適用した場合と同一の結果が得られることを保証できる.しかも,計算量を大幅に減らすことができる.重み付きデータのデータ数をn_d,重みの分だけ複製して得られる総データ数をnとすると,固有値分解の計算量は(n_d/n)^<1.5>に抑えられる.提案法の従来法に対する修正は,二つのデータ間の類似度関数の定義を変更するだけという,わずかな修正で実現可能であることも示す.提案法を用いた実験として,2種類の実験結果を示す.従来のNormalized Cutsでこれらの実験を行うには限界があるが,提案法の導入により,扱える問題のサイズを広げることができる.
- 2007-09-01
論文 | ランダム
- 9-329 機械工学科における電子回路製作実験の試み : 電子回路の設計製作をとおして基本的知識を身につける((11)ものつくり教育-V,口頭発表論文)
- 2-333 地域社会に貢献する高大連携・ものづくり実習プログラムの構築と実践 : スターリングエンジンとテルミンを題材とした機械系・電子回路系合同開催の取り組み((09)高大院連携,口頭発表論文)
- 著名な鉄筋コンクリート造建物の耐久性診断を経験して
- 1524 葛生産骨材の品質とそれを用いたコンクリートの性質 その2(骨材(1),材料施工)
- 1523 葛生産骨材の品質とそれを用いたコンクリートの性質 その1(骨材(1),材料施工)