ブログ記事のクラスター構造と経時変化の可視化
スポンサーリンク
概要
- 論文の詳細を見る
ウェブ上にはブログをはじめとして一般ユーザにより生産された大量のテキストデータが蓄積されており,その量は今後も継続的に増加すると考えられる.我々はタイムスタンプ付きテキスト集合のクラスター構造とその経時変化を可視化するための手法を提案してきたが,そこでは文書ベクトルの次元削減と潜在意味処理を行なうために全データを一括して処理する必要があった.そのため,ブログなど大量のテキストが生産される続ける漸増的環境に適用するには問題があった.本稿では,ブログのような漸増的動的環境下でも,潜在意味処理を伴なったクラスタリングと可視化を効率良く行うための、文書ベクトル生成手法を提案し,例として収集したブログ記事集合への適用結果を示す.
- 2011-03-21
著者
関連論文
- 潜在的学習者への市場セグメンテーションの応用可能性--メディア(ブログデータ)の教育における活用例として (メディアの活用と教育・学習環境/一般)
- 2-B-2 ブログテキストを用いた市場セグメンテーション(マーケティング(1))
- 3C-6 クラスター構造の経時変化を可視化するためのTime-Arrayed SOMの提案(Web検索支援,一般セッション,データベースとメディア,情報処理学会創立50周年記念)
- 長大な時系列データに対する部分時系列データの類似検索手法の提案(セッション3:データマイニング)
- 長大な時系列データに対する部分時系列データの類似検索手法の提案(セッション3:データマイニング)
- ブログ記事のクラスター構造と経時変化の可視化
- ブログ記事のクラスター構造と経時変化の可視化
- 潜在的学習者への市場セグメンテーションの応用可能性 : メディア(ブログデータ)の教育における活用例として
- 1-F-8 大量ブログ記事をデータとした市場セグメンテーションの半自動的分析手順(マーケティング)
- ブログ記事の収集と予備分析 : 大規模分析に向けて