文章の識別モデルを状態とするHMMによるテキストの段落分割
スポンサーリンク
概要
- 論文の詳細を見る
テキストセグメンテーションに対する新たな分類モデルを提案する.一般に HMM によるテキストセグメンテーションは,状態を段落に対応させ,各状態においては,その段落にふさわしい単語の出力確率を学習することにより文書をモデル化する.本研究では,HMM の状態を段落に対応させる点はそのままとし,各状態において 1 つの文章を受け入れる識別モデルを構成することにより文書全体を認識するモデルを提案する.すなわち本手法における HMM の各状態は,その状態が表す段落にふさわしい文章を高確率で受け入れ,ふさわしくない文章を低い確率で受け入れる事により段落を表現するモデルとなる.評価実験として,ウェブニュース記事の分類問題を行い,従来手法よりも性能が向上することを確かめた.
- 2012-02-23
著者
関連論文
- 強化学習によるゲームの評価関数の獲得
- 強化学習による評価関数の獲得における報酬設定について
- 深さに応じたバイアスによるモンテカルロ木探索の効率化
- 分割位置を教師値としたテキストの段落分割
- 文章の識別モデルを状態とするHMMによるテキストの段落分割
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- D-5-11 Webニュースに対するコメントの感情推定(D-5.言語理解とコミュニケーション,一般セッション)
- 言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- マイクロブログのインフォーマルな書き込みに対する自動分類