連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
スポンサーリンク
概要
- 論文の詳細を見る
連続型HMMによるテキストセグメンテーション手法を示す.一般にHMMによるテキストセグメンテーションは,1つの単語を出力記号とし,学習データを用いて状態遷移および各状態における出力記号の確率分布を求める.これに対し本研究では,テキストデータ内のある一定の範囲をテキスト窓とし,テキスト窓内の単語の出現数をベクトルとして出力記号とする.このようなHMMを用いてテキストセグメンテーションを行い,ウェブのニュース記事が複数結合されたテキストデータに対して評価実験を行った.その結果,ランダムに話題が移り変わるようなテキストデータに対して,従来手法よりも高い性能を得ることができた.
- 2011-10-03
著者
関連論文
- 強化学習によるゲームの評価関数の獲得
- 強化学習による評価関数の獲得における報酬設定について
- 深さに応じたバイアスによるモンテカルロ木探索の効率化
- 分割位置を教師値としたテキストの段落分割
- 文章の識別モデルを状態とするHMMによるテキストの段落分割
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- 連続型HMMを用いたテキストセグメンテーション(基礎技術,自然言語処理)
- D-5-11 Webニュースに対するコメントの感情推定(D-5.言語理解とコミュニケーション,一般セッション)
- 言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- コンピュータ大貧民における高速な相手モデル作成と精度向上
- マイクロブログのインフォーマルな書き込みに対する自動分類