多言語トピックモデルによる言語横断リンク検出
スポンサーリンク
概要
- 論文の詳細を見る
トピックモデルは大規模なテキストデータコレクションの解析に広く使用されているアプローチである.最近,Wikipediaを典型とする並列または比較可能な多言語データにおいて潜在トピックを発見する多言語トピックモデルが研究されている.また,元々は内部構造を持つ文書を対象として開発されたトピックモデルのうち,多言語の文書にも適用可能なものがある.しかしながら,現在まで多言語トピックモデルの比較評価を行った報告は我々の知る限りない.我々は多言語文書データに適用可能ないくつかのトピックモデルの性能を,テストセット対数尤度,トピック割り当てのヒストグラム,そして言語横断ストーリーリンク検出タスクに着目して比較評価した.実験により,これまで多言語に関連した研究に用いられてこなかったトピックモデルのいくつかが,従来研究で用いられた多言語トピックモデルより優れていることを示した.
- 2011-05-09
著者
-
江口 浩二
神戸大学大学院工学研究科情報知能学専攻
-
松浦 愛美
神戸大学工学部情報知能工学科
-
江口 浩二
神戸大学大学院システム情報学研究科
-
福増 康佑
神戸大学
-
松浦 愛美
神戸大学|現在,東京大学
-
松浦 愛美
神戸大学|現在 東京大学
-
江口 浩二
神戸大学
関連論文
- 意見文検索のための言語モデルにおける局所文脈スムージング(自然言語処理,情報検索,情報爆発論文)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出(情報検索 Web情報システム,データ工学論文)
- 情報検索のための確率的言語モデルに関する動向と課題(情報検索,データ工学論文)
- 多重トピックを用いたブログ空間の情報伝搬解析(ブログ・情報検索)
- 多型トピックモデルを用いたアノテーション付き文書に対する検索手法(テキストマイニング,データ工学論文)
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- 潜在トピックを用いたブログ空間からの情報伝搬ネットワーク抽出
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 情報検索のための確率的言語モデルに関する動向と課題
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- カテゴリ階層構造を考慮した確率的トピックモデルとその応用
- 2-102 プログラミング相談室 : 全員の基礎スキルレベルアップのために((2)専門科目の講義・演習-I,口頭発表論文)
- 情報検索のための確率的言語モデル
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 意見文検索のための言語モデルにおける局所文脈スムージング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 混合メンバーシップ・ブロックモデルを用いた協調フィルタリング
- 時系列対訳トピックモデルを用いた言語横断トレンド分析
- 情報検索のための確率的言語モデル
- 3N-2 時系列トピックモデルを用いた言語横断トレンド分析(数理モデルとデータマイニング,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 大規模ネットワーク構造の確率的グループモデルに基づくリンク予測
- 多重多型トピックモデルを用いたアノテーション付きテキストからのエンティティ検索(Wikipedia)
- 学術文献の潜在トピックに着目したタンパク質相互関係に関する知識の抽出
- 2ZL-2 確率的トピックモデルを用いた医学生物学文献情報に基づく仮設生成(バイオインフォマティクスと医療,学生セッション,コンピュータと人間社会,情報処理学会創立50周年記念)
- 5J-5 トピック依存型意見検索モデルの開発とブログに対する評価(情報爆発時代におけるWebおよびblogマイニング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 1R-6 重回帰分析を用いた近接クエリの重み推定によるWeb情報検索(Web検索支援,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- カテゴリ構造を用いた確率的トピックモデルの効率的推定とその応用
- 多言語トピックモデルによる言語横断リンク検出
- 多言語トピックモデルによる言語横断リンク検出
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- Collapsed変分ベイズLDAによるタンパク質相互作用予測(医用情報処理)
- 正則化付きリンク構造解析を用いたコールドスタート推薦
- MPI/OpenMPハイブリッド並列化による潜在的ディリクレ配分法の効率的推定(統計的言語処理,テキスト・Webマイニング,一般)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 自然言語文からの構造化クエリの自動生成によるWeb情報検索(Web解析・検索クエリ)
- 回帰分析のためのマージン最大化トピックモデルのギブスサンプリング推定
- 回帰分析のためのマージン最大化トピックモデルのギブスサンプリング推定
- 回帰分析のためのマージン最大化トピックモデルのギブスサンプリング推定(匿名化・回帰分析・問合せ,ビッグデータを対象とした管理・情報検索・知識獲得及び一般)
- 映像データにおける局所特徴のバースト性を考慮したトピックモデリング(一般セッション,一人称ビジョン,セキュリティとプライバシーの確保,産学共同研究紹介)