統計情報と文章構造特徴に基づく重要文の自動抽出
スポンサーリンク
概要
- 論文の詳細を見る
インターネットを代表とするコンピュータネットワークの発達や、CD-ROM等の大容量メディアによる出版物の普及が進み、多くの電子化された文書が流通するようになっている。本稿ではこのような文書情報へのアクセス支援のための重要文抽出方法について考察し、統計情報と文章構造特徴に基づくアプローチを提案する。重要文抽出は従来の自動要約概念と似ているが、重要文抽出では、抽出した文全体の文脈や、流暢性があまり気にしない点のみ違う。本手法では単に統計情報を用い要約文の作成を行うことではなく、文の意味的な構造情報も利用したので、従来の統計手法より、より良い重要文の抽出が期待される。この手法に基づき、重要文自動抽出実験システムを構築し、科学技術論文を用い、評価実験を行った。実験結果から、本文で提案した手法の有効性と実用性を確認することができた。
- 一般社団法人情報処理学会の論文
- 1998-05-28
著者
関連論文
- 統計手法と言語特徴を用いたテキストアライメント
- 自然言語記述からプログラムへの生成を支援するシステムの提案
- 対訳コーパスから細粒度翻訳知識の自動獲得手法
- 関連語を用いた文の分解に基づく中日機械翻訳システム
- 中日機械翻訳における離合詞の処理手法
- 統計手法と言語特徴を用いたテキストアライメント
- TSPO特徴を利用した中日機械翻訳
- 中日言語のTSPO特徴及びCJMTへの応用について
- 統計情報と文章構造特徴に基づく重要文の自動抽出
- 中国語機械翻訳における敏感語概念