ニュースにおけるトピックのバースト特性の分析
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,時系列ニュースを対象として,情報集約を行うための二種類の方式として,バースト解析およびトピックモデルの2つの手法の考え方を組み合わせることにより,トピックのバーストを検出する方式を提案する.時系列ニュースにおけるバーストとは,世の中における特異な出来事に対応して,ある時期からその出来事に関連するニュース記事が急激に増加する現象を指す.バーストを検出するための代表的な手法として,Kleinbergのバースト解析が挙げられる.この手法においては,一般的に,バーストの検出はキーワード単位で行われる.一方,文書集合におけるトピックの分布を推定するものとしてLDA (latent Dirichlet allocation) やDTM (dynamic topic model) に代表されるトピックモデルがある.トピックモデルを適用することにより,ニュース記事集合全体の情報を,いくつかのトピックに集約することができる.以上の既存技術をふまえて,本論文では,DTMを用いて推定したトピックに対してバースト度を付与することで,トピック単位のバーストが検出可能であることを示す.
- 2011-11-14
著者
-
吉岡 真治
北海道大学
-
吉岡 真治
北大
-
宇津呂 武仁
筑波大学大学院システム情報工学研究科
-
吉岡 真治
北海道大学大学院情報科学研究科
-
吉岡 真治
北海道大学大学院
-
吉岡 真治
北海道大学情報科学研究科コンピュータサイエンス専攻
-
横本 大輔
筑波大学第三学群工学システム学類
-
吉岡 真冶
東京大学
-
高橋 佑介
筑波大学大学院システム情報工学研究科
-
横本 大輔
筑波大学大学院システム情報工学研究科
-
宇津呂 武仁
筑波大学システム情報系
-
吉岡 真治
北海道大学大学院情報科学研究科コンピュータサイエンス専攻
関連論文
- 編集にあたって
- 語彙概念構造を利用した複合名詞内の係り関係の解析(システムLSIの設計技術と設計自動化)
- 極大類比による文書群の組織化
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- 115 創造的設計のための仮説的知識生成支援の研究(創造・創発〔II〕)
- 3110 格文法分類と知識テンプレートに基づく知識表現(OS9-4 ライフサイクル設計とサービス工学-IV)知識表現)
- アブダクションによる創造的設計支援
- 1405 概念ネットワークを活用したアナロジーによる仮説的設計知識の生成手法(OS1 ソフト人工物II)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して
- 特許情報を対象とした機械翻訳 : 共通基盤による評価タスクを目指して(文書分類・翻訳)
- 代表・派生関係を利用した日本語機能表現の解析
- 編集にあたって
- 編集にあたって
- Webリンク活用のためのアンカーテキストの自動分類の研究(セッション1:メタデータと自動分類、知識支援)
- Webリンク活用のためのアンカーテキストの自動分類の研究(セッション1:メタデータと自動分類、知識支援)
- 4ZK-8 ハイパーリンク活用のためのアンカーテキストの役割分析と分類の研究(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 物語の構造汎化一結束性と展開構造の類似性 (「AIを深化させるための基本問題」および一般)
- 語彙的結束性を利用した複数の物語の共通構造把握 (ことば工学研究会(第28回)テーマ:創る)
- 2関節筋モデルを組み込んだ動作生成について (「スキルサイエンス」「論理プログラミング」及び一般)
- マイナーなテキスト情報をも活用する情報アクセス技術
- 情報学基礎研究会(研究会千夜一夜)
- 情報源の特性を考慮した情報アクセス(編集委員2007年の抱負)
- 2303 透過型オントロジーによるターミノロジー管理(OS2 ライフサイクル設計とサービス工学II:ツール,未来社会を支えるものづくりとひとづくり(設計・システムから))
- Web情報活用のためアンカーテキストの分類と利用(文書分類・評判分析)
- Web情報活用のためアンカーテキストの分類と利用(文書分類・評判分析)
- アブダクションに基づく設計者支援環境の基本構想(機械要素, 潤滑, 工作, 生産管理など)
- 検索語の網羅性に注目した汎化概念により検索語選択支援を行う情報検索システムの研究
- 2827 タグ付け手法に基づく創造的設計支援(S61 機械設計における情報共有)
- 日本語機能表現の自動検出と統計的係り受け解析への応用
- 機能表現を考慮した統計的日本語係り受け解析(解析・対話)
- Wikipediaを介した関連ニュース・ブログの対応付け? Wikipediaエントリの分析?
- 特定トピックの日英ブログ収集・分析・類型化:事例研究
- 1.キーワードサーチを超える情報爆発サーチ : 自然言語処理で価値ある未知をマイニング(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(情報の検索とテストコレクション)
- 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
- 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
- 3203 人工物工学の展開(第 18 報) : Universal Abduction Studio の提案
- 設計知識管理のためのCADアーキテクチャーの提案
- 2816 将来の不確実性を考慮したアップグレード設計支援システムの開発
- 1201 インバースマニュファクチャリングのためのアップグレード設計支援システムの開発
- インパース・マニュファクチャリングのためのアップグレーダブル設計(第5報):不確実性に対応した設計支援ツールの開発
- 3104 将来の不確実性に対応したアップグレード設計方法論(OS02/インバースマニュファクチャリング)
- インバース・マニュファクチャリングのためのアップグレーダブル設計(第3報) : 支援システムの試作
- Wikipediaを用いた中日カタカナ翻訳辞書の作成と言語グリッドヘの応用(言語グリッドと異文化コラボレーション)
- 距離尺度学習を用いた多次元尺度構成法(MDS)による可視化結果のインタラクティブな操作方法の提案
- 距離尺度学習を用いた多次元尺度構成法(MDS)による可視化結果のインタラクティブな操作方法の提案
- 編集にあたって
- 複数国ニュースサイトの比較対象分析システム NSContrast における評価手法に関する検討
- 編集にあたって
- 特集「情報爆発時代に向けた新しいIT基盤技術の研究」にあたって(情報爆発時代に向けた新しいIT基盤技術の研究)
- 特集「情報爆発時代に向けた新しいIT基盤技術の研究」にあたって
- Research Index : 新しい形の電子図書館(Web探訪)
- 情報検索における検索語拡張手法の有用性分析手法の提案
- Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
- 参加者から見たNTCIR(NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
- 3305 文書情報と形式化された知識を融合する知識マネージメントシステムの研究(G01-2/一般(2))(G01/一般)
- 距離尺度学習を用いた多次元尺度構成法(MDS)による可視化結果のインタラクティブな操作方法の提案
- 人間と人工知能の得手不得手
- デ-23 複数国のニュース比較分析システム : NSContrast(デモセッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 複数国の新聞サイトを比較分析するNSContrastの実験的分析
- 適合的汎化に基づく情報検索システムの研究(第1報) : 検索語が持つ適合性判定への寄与度の利用
- 設計対象知識操作論
- Universal Abduction Studioによる創造的設計のための知識スキーム(ソフト人工物III)
- 2103 創造的設計のための仮説的知識の生成手法
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 編集にあたって
- 2302 Web情報を用いた設計知識情報データベースの拡充手法
- 1311 表層格タグ付け知識を用いた創造的設計支援のための知識表現
- ニュースにおけるトピックのバースト特性の分析
- ニュースにおけるトピックのバースト特性の分析
- 2306 プログラム・マネジメントのための利害関係者ネットワーク抽出支援の研究(OS07 設計におけるナレッジマネジメントII)
- 情報検索のテストコレクションにおける検索語の有用性に関する検討(セッション1: 言語情報・情報検索)
- 情報検索のテストコレクションにおける検索語の有用性に関する検討(セッション1: 言語情報・情報検索)
- 人間と人工知能の得手不得手(ようこそ人工知能の世界へ : 編集委員今年の初夢)
- クエリー駆動方式の文書間極大類比構築法(意味表現・データマイニング)
- 適合的汎化に基づく情報検索システムの研究(第2報) : 検索語の網羅性に注目した検索インタフェースの作成(情報抽出・構造分析)(ユビキタス社会における情報流通および一般)
- NTCIRプロジェクト
- 質問応答のための情報検索への応用を目的とした確率型検索モデルとブーリアン検索モデルの組合せ
- 2314 人工物工学研究の展開(第15報) : 設計者の思考パターンの発見による知識獲得(OS05-2/人工物工学研究の展開)(OS05/人工物工学)
- NTCIR-9総括と今後の展望
- NTCIR-9総括と今後の展望
- Wikipediaを中心としたLinked Open Dataに関する一考察
- Wikipediaを中心としたLinked Open Dataに関する一考察
- 極大類比による文書群の組織化
- Wikipediaカテゴリを用いたWikipediaとGeoNames間のリンク発見とメンテナンス
- 言語情報処理ポータル
- 特集「Intelligent Manufacturing Systems:IMS」にあたって(Inteligent Manufacturing Systems:IMS)
- Al in Design Webliography(Web 探訪)
- AI Topics (AAAI)
- 特長表現に注目した特許マップの自動生成
- 特長表現に注目した特許マップの自動生成
- 日中時系列ニュース・ブログにおけるトピックモデルの推定と分析(分析,第2回テキストマイニング・シンポジウム)
- 特長表現に注目した特許マップの自動生成(情報検索(1),ビッグデータを対象とした管理・情報検索・知識獲得及び一般)