トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
評価文書に付与されているトピック情報を評価文書分類に利用することは有益であるが、本稿ではトピックモデルを用いて、トピックタグの付与されていない評価文書であっても、自動的にトピックを識別し評価文書分類を行う方法を提案する。Probabilistic Latent Semantic Analysis (PLSA)を用いてトピック構造をモデル化するが、モデルの学習を行う際には、トピック情報を極性間において共通に扱うために単語毎の極性事後確率を導入し、識別学習を行う。実験においては、提案手法によって評価文書分類精度が向上することと、学習によって得られたモデルから自動的にトピック依存評価表現辞書を構築できることを示す。
- 2008-01-31
著者
-
貞光 九月
筑波大学システム情報工学研究科
-
福富 崇博
筑波大学システム情報工学研究科
-
山本 幹雄
筑波大学システム情報工学研究科
-
山本 幹雄
筑波大学大学院システム情報工学研究科
-
山本 幹雄
沖テクノシステムズラボラトリ(株)
-
山本 幹雄
豊橋技術科学大学情報工学系中川研究室
-
山本 幹雄
筑波大学システム情報系
関連論文
- トピック教師なしデータからのトピック依存評価表現モデルの獲得(「主観表現処理の最前線」シンポジウム)
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定
- フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定(自然言語処理)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して(NTCIR特別セッション)
- 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
- 確立・統計的言語モデル (特集 脳とことばとコンピュータ--脳の高次機能の解明に向けて)
- 確率・統計情報を用いた文法研究 (新・文法用語入門) -- (新しい文法研究)
- 日本語音声コ-パスの比較・選択の方法
- 6U-2 特許文に対するクロストリガーモデルを用いた統計的機械翻訳システム(自然言語処理,学生セッション,人工知能と認知科学)