時系列テキストデータからのアラート情報の抽出と俯瞰(情報の整理,第2回テキストマイニング・シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
日報や雑誌・論文、Web上の書き込みなど、時系列で生成される文書群には、一定期間・頻度で現れる話題や、急に現れる話題がある。これら文書群を分析する際に、情報の時間変化を追いやすくしつつ、新規の話題の生成を抑制しないクラスタリング手法を報告する。時間軸で区切った単位でのクラスタ生成時に、過去時点のクラスタの代表的特徴語を距離計算重視語として文書間の距離計算に過去情報を反映させる。また、新規に現れた特徴語を距離計算重視語とすることにより、新規クラスタの生成を促進する。サンプルデータで検証した結果、過去の話題の流れを追いつつ、新規の話題を発見できることが示唆された。
- 一般社団法人電子情報通信学会の論文
- 2012-08-23
著者
関連論文
- メタデータの視覚化・操作による制約条件構築支援 (テーマ:「Web Intelligence」および一般発表)
- Web コンテンツからのオントロジーの再構成方法の提案と試作 : 情報提供サービスのためのオントロジー構築支援技術
- E-019 日常の文書管理操作を用いた企業オントロジーの自動構築(E分野:自然言語)
- E-008 情報検索システム"CoreExplorer"を用いたメーリングリスト間の関連トピック分析(E.自然言語・文書・ゲーム)
- 組織・グループ・個人の知識マップを用いたコラボレーション支援(「セマンティックWeb」特集及び一般)
- 時系列テキストデータからのアラート情報の抽出と俯瞰(情報の整理,第2回テキストマイニング・シンポジウム)
- メタ文字を含む文字列に対するVantage-Point木を用いた類似文字列検索