潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,<特集>データ工学論文)
スポンサーリンク
概要
- 論文の詳細を見る
近年ブログの利用が爆発的に増加しており,重要な情報源の一つになりつつある.ブログは,ハイパリンクを利用することで,参考にした情報を明示的に参照することが可能であり,このネットワークを対象にした研究が最近注目されつつある.しかし,こういった研究のほとんどが,リンク情報のみを対象にしており,本文の情報を参照していない.そこで本研究では,リンク構造だけでなく,本文のトピックを推定し,適切に情報伝搬をとらえる手段を確立することを目的とする.文書集合の潜在的なトピックを統計的に推定するのに用いられる確率的トピックモデルの代表的なものに,潜在的ディリクレ配分法(Latent Dirichlet Allocation:LDA)が挙げられ,広く用いられている.本研究では,このLDAを用いてポストのトピックを推定し,リンク間のトピック分布を比較することで,情報伝搬の単位(カスケード)を的確に抽出する枠組みを提案する.日本語ブログデータを用いた実験において,提案手法の有効性を示す.
- 2010-03-01
著者
-
横山 正太朗
神戸大学大学院工学研究科情報知能学専攻
-
江口 浩二
神戸大学大学院工学研究科情報知能学専攻
-
大川 剛直
神戸大学大学院工学研究科情報知能学専攻
-
大川 剛直
神戸大学大学院 工学研究科
-
江口 浩二
神戸大学大学院システム情報学研究科
関連論文
- 意見文検索のための言語モデルにおける局所文脈スムージング(自然言語処理,情報検索,情報爆発論文)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,データ工学論文)
- 情報検索のための確率的言語モデルに関する動向と課題(情報検索,データ工学論文)
- 多重トピックを用いたブログ空間の情報伝搬解析(ブログ・情報検索)
- 多型トピックモデルを用いたアノテーション付き文書に対する検索手法(テキストマイニング,データ工学論文)
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 情報検索のための確率的言語モデルに関する動向と課題
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- 多重解像度解析を応用したフレーム合成による遠方車両認識手法の提案(テーマセッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 動画像のフレーム合成による低解像度車両認識技術に関する研究
- 2-102 プログラミング相談室 : 全員の基礎スキルレベルアップのために((2)専門科目の講義・演習-I,口頭発表論文)
- 情報検索のための確率的言語モデル
- 蛋白質-化合物複合体立体構造データに基づく類似相互作用蛋白質の検索方式(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- ユーザフィードバックに基づく訓練データ拡張を伴う蛋白質機能情報文抽出に関する研究
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- ビル空調の制御装置の診断システム
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- 情報検索のための確率的言語モデル
- 3N-2 時系列トピックモデルを用いた言語横断トレンド分析(数理モデルとデータマイニング,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 大規模ネットワーク構造の確率的グループモデルに基づくリンク予測
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- 内部および外部重みを考慮した頻出部分グラフマイニング
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- コーパスからの文選択による事例集合拡張に基づく蛋白質名判定
- 複合構造グラフからの頻出強相関パターン発見
- 距離の再定義を伴う事例選択を用いたタンパク質機能情報文抽出方式
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 部分代謝構造を用いた代謝パスウェイの比較解析
- 関連データに基づく事例集合拡張による文献からの蛋白質名判定
- RG-001 概念階層を用いたタンパク質構造・機能情報に基づく関連文献検索支援システムの構築(生体情報科学,査読付き論文)
- タンパク質機能情報文抽出規則の繰り返し学習における効果的学習順序の探索
- 時系列画像のエッジを利用した剛体仮定によるマッチング法の提案
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 仮想濃度勾配を用いた輪郭線の動き検出(一般セッション(2), ユビキタスメディアの将来展望)
- 学術文献の潜在トピックに着目したタンパク質相互関係に関する知識の抽出
- 2ZL-2 確率的トピックモデルを用いた医学生物学文献情報に基づく仮設生成(バイオインフォマティクスと医療,学生セッション,コンピュータと人間社会,情報処理学会創立50周年記念)
- 局所類似構造を用いた蛋白質機能部位発見に関する研究
- 座標基準点探索による蛋白質相互作用プロファイルの抽出(DNA・タンパク質構造)
- 5J-5 トピック依存型意見検索モデルの開発とブログに対する評価(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 蛋白質-化合物複合体の相互作用部位プロファイルを用いた類似相互作用蛋白質検索方式(Sequence & structure analysis)
- 1R-6 重回帰分析を用いた近接クエリの重み推定によるWeb情報検索(Web検索支援,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- 蛋白質分子表面モチーフの抽出とその並列化実装(バイオインフォマティックス, 第11回MPSシンポジウム: 複雑系の科学とその応用)
- 蛋白質分子表面モチーフの抽出とその並列化実装
- 多言語トピックモデルによる言語横断リンク検出
- 多言語トピックモデルによる言語横断リンク検出
- 制限付き最右拡張を用いた効率的な飽和順序木の発見
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- スネークス手法を使った先行車両認識手法(一般セッション(1), ユビキタスメディアの将来展望)
- 正則化付きリンク構造解析を用いたコールドスタート推薦
- 反応構造プロファイルによる異種生物種間の代謝パスウェイ比較解析
- MPI/OpenMPハイブリッド並列化による潜在的ディリクレ配分法の効率的推定(統計的言語処理,テキスト・Webマイニング,一般)
- D-12-52 射影変換による画像中の障害物検出(D-12.パターン認識・メディア理解,一般講演)
- 蛋白質機能情報抽出支援システムPROFESSにおけるSVMを利用した機能情報文特定方式(Text mining)
- タンパク質の立体構造情報と類似部分グラフマイニングを利用した結合部位の自動抽出に関する研究(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 利用者の意図を考慮した概念的観点に基づく蛋白質構造解析文献検索手法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 文の接続関係を考慮した蛋白質構造解析文献からの相互作用記述文抽出方法(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 3次元画像特徴量を用いた蛋白質分子表面比較
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出
- 複数の分類器に基づく半教師あり学習を用いた文献からの蛋白質間相互作用抽出(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- 3次元画像特徴量を用いた蛋白質分子表面比較(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
- 映像データにおける局所特徴のバースト性を考慮したトピックモデリング(一般セッション,一人称ビジョン,セキュリティとプライバシーの確保,産学共同研究紹介)