統計的手法によるテキストからのキーワード抽出法

スポンサーリンク

概要

論文の詳細を見る
本論文では簡単な字面処理によって,文章からキーワード候補を自動抽出する方法について述べる.日本語のキーワードの自動抽出法では文章から単語を得るために,形態素解析が必要であるが,形態素解析には未知語や曖昧性の解消などの問題があり,これを解決するために,従来は複雑な規則や人手によって作成される辞書が必要であった.本手法では完全な字面処理からのアプローチとしてNグラムの頻度情報を用いる.まず,Nグラム頻度情報から重要な文字列を抽出し,次にその中から無意味な文字列を排除する.これによって簡単な字面処理だけによって,キーワード候補の抽出が可能になった.また実験の拡大,再現も容易である.
社団法人電子情報通信学会の論文
1995-05-26

著者

関連論文

もっと見る

スポンサーリンク