表層情報を利用したネットニュース領域構造解析

スポンサーリンク

概要

論文の詳細を見る
インターネットを流通する電子化情報のうち、構造化が行われておらず、引用を表す記号等、通常のテキストとは異なる文字の用法が存在するネットニュースや電子メールを対象として、情報抽出や要約を容易にするための自動構造解析を検討している。このうち本稿では、引用構造、および、内容的な領域区分-ある投稿者が記述した文章、ニュースリーダが自動的に挿入した文章、署名-を、空行等により分割された領域単位に、表層的に得られる文字種や位置情報等を属性とした決定木を用いて解析する方法を提案する。また、ネットニュースコーパスを用いた実験を行い、本手法の有効性を示す。
一般社団法人情報処理学会の論文
1999-07-22

著者

関連論文

もっと見る

スポンサーリンク