グラフデータを対象とした重み付きReservoir Sampling
スポンサーリンク
概要
- 論文の詳細を見る
近年、ソーシャルメディアや SNS の爆発的な普及に伴い、データ解析の対象は従来の単純な表構造データから、人・物・場所といった多様な情報のつながりを表現可能なグラフ構造へとシフトしつつある。グラフの様々な特徴量を得るためにサンプリング手法が重要である。これまでのグラフサンプリング手法では、ランダムウォークがよく用いられ、グラフ構造を探索しながらサンプルを抽出する。しかし、ランダムウォークは、一部の次数の高いノードに偏り、一様なサンプルを抽出することができない問題点がある。本研究では、我々は重み付き Reservoir Sampling アルゴリズム RWW を提案し、高次数ノードへの偏りを解消できるだけではなく、グラフ探索範囲の拡大やグラフの進化に対応できるサンプル抽出を実現する。シミュレーション実験では、評価対象のグラフをランダムグラフとして生成し、提案手法によってサンプルを抽出する。抽出した結果の次数分布を中心に、理想なサンプル結果と比べ、類似度を評価した。
- 2013-11-19
著者
関連論文
- アクセス履歴とディレクトリ型検索システムを用いた利用者集合の興味動向分析(Webログ)(夏のデータベースワークショップDBWS2004)
- アクセス履歴とディレクトリ型検索システムを用いた利用者集合の興味動向分析(セッション1A : Webログ)(夏のデータベースワークショップ : DBWS2004)
- 物理的教室と複合した仮想教室環境の開発(eラーニング1, 夏のデータベースワークショップDBWS2005)
- 半永続データのモデル化及び自己組織化管理の諸問題の考察(ストリームデータ1, 夏のデータベースワークショップDBWS2005)
- 物理的教室と複合した仮想教室環境の開発(eラーニング1, 夏のデータベースワークショップ2005)
- 半永続データのモデル化及び自己組織化管理の諸問題の考察(ストリームデータ1, 夏のデータベースワークショップ2005)
- D-012 ランダムウォークによるグラフデータのサンプリング手法(D分野:データベース,一般論文)
- D-002 スポンサードサーチにおける近似辞書検索アルゴリズム(D分野:データベース,一般論文)
- D-028 異種分散情報源の統合による書籍情報の統括的検索の実現(D分野:データベース,一般論文)
- グラフデータを対象とした重み付きReservoir Sampling