Wikipediaを知識源とする分野トピックモデルの推定と分析
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,特定のキーワードをクエリとして収集したブログ記事集合を対象として,ブログ記事集合中の話題の広がりを俯瞰することを目的として, Wikipedia を知識源とする分野トピックモデルを提案し,その推定法,および,ブログ記事集合への適用結果について述べる.具体的には,ブログ記事集合から抽出した Wikipedia エントリタイトルに対して, 「地球温暖化」 における 「気象学・天文学・生物学・エネルギー・工業」 といった分野に対応するトピックモデルを推定し,その特性を分析する.特に,この Wikipedia を知識源とする分野トピックモデルを,ブログ記事集合から推定した通常のトピックモデルと比較して,両者の特性の違いを分析し,ブログ記事集合中の話題の広がりを俯瞰する目的において両者が相補的な関係にあることを示す.
- 2012-11-12
著者
-
河田 容英
(株) ナビックス
-
鈴木 浩子
筑波大学大学院システム情報工学研究科
-
牧田 健作
筑波大学大学院システム情報工学研究科
-
河田 容英
(株)ログワークス
-
小池 大地
筑波大学大学院システム情報工学研究科
-
宇津呂 武仁
筑波大学システム情報系
関連論文
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- Wikipediaエントリとブログサイトの対応付けによる日本語ブログ空間のトピック分布推定(トピック)
- スプログ検出におけるHTML構造の類似性の有効性の評価
- 5J-6 キーワードのバースト特性を利用したスパムブログデータセットの作成と分析(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 5K-5 HTML構造の類似性を利用した大規模スパムブログ収集(情報爆発時代におけるWeb解析,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 5J-3 特定トピックのブログサイト検索 : Wikipediaエントリとブログサイトの対応付けに向けて(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Wikipediaを多言語知識源とするブログ集合の話題分析 (言語理解とコミュニケーション)
- Wikipediaを知識源とする日英ブログ記事集合の観点分類と言語間対照分析
- ニュースにおけるトピックのバースト特性の分析
- Wikipediaを多言語知識源とするブログ集合の話題分析(意見抽出/文書分類,第1回テキストマイニング・シンポジウム)
- Wikipediaを知識源とする分野トピックモデルの推定と分析
- 日中ブロガー・コミュニティの収集・俯瞰・対照分析
- 日中ブロガー・コミュニティの収集・俯瞰・対照分析
- パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用
- 日中時系列ニュース・ブログにおけるトピックモデルの推定と分析(分析,第2回テキストマイニング・シンポジウム)
- 日中ブロガー・コミュニティの収集・俯瞰・対照分析(ブログ・ソーシャルネットワーク,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)