階層Pitman-Yorトピックモデル(一般講演(学習の理論),機械学習とその応用)
スポンサーリンク
概要
- 論文の詳細を見る
トピックモデルは,単語のもつ潜在的な意味をトピックという概念によってモデル化することで文書の生成過程をモデル化する確率的生成モデルである.本研究では,文書中の単語の出現に関してPower-Lawと呼ばれる性質を導入する.具体的にはPitman-Yor過程を用いて文書中の単語の生成過程をモデル化する.Power-Lawの性質の導入により,少ないトピック数でも低いPerplexityを保持することを実験的に示す.
- 社団法人電子情報通信学会の論文
- 2010-06-07
著者
-
中川 裕志
東京大学情報基盤センター
-
佐藤 一誠
東京大学
-
佐藤 一誠
東京大学情報理工学系研究科
-
佐藤 一誠
東京大学大学院情報理工学系研究科
-
佐藤 一誠
東京大学大学院 情報理工学系研究科
-
中川 裕志
東京大学情報基盤センタ
関連論文
- テキストマイニングの活用(データマイニングの活用)
- 多クラス識別問題におけるPassive-Aggressiveアルゴリズムの効率的厳密解法(自然言語処理,知識獲得,情報爆発論文)
- 2P-8 ソーシャルブックマークにおけるスパムの検出(Webマイニング,学生セッション,データベースとメディア)
- 同義語辞書作成支援システム
- Word 2003 XML文書への情報ハイディングシステム
- 〈情報処理学会 情報学基礎研究会 (F1) 第96回 発表論文〉 接尾辞配列とディリクレ過程混合モデルを用いたテキスト中の数値表現マイニング (筑波大学東京キャンパス(秋葉原地区). 2009年11月19日)
- コーパス検索支援のための動的同義語候補抽出
- コンテンツの生産・活用に関する研究 : 科研「情報学」プロジェクトのコンテンツ研究を振り返って(「情報学を創る」-科研プロジェクトがめざしたもの)
- 25aQL-9 量子アニーリング法を用いた変分ベイズ推定(情報統計力学,領域11,統計力学,物性基礎論,応用数学,力学,流体物理)
- HTMLの表形式データの構造認識と携帯端末表示への応用