単語の文書頻度と文の長さを利用した抄録縮約方式

概要

論文の詳細を見る
近年,携帯電話やPHSを用いてのWebページの閲覧サービスのニーズが高まってきている.ところが,従来のWebページはパソコンなど大画面での閲覧を前提としているため,携帯電話やPHSなど表示画面の小さい端末では画面切り替えの回数も増え,使いにくいものとなっている.この点を解決するため,Webページを縮約することが必要である.そこでWeb表示サービスされている図書概要を対象に,さらに短く縮約する方式を開発することとした.まず図書概要の縮約方式として,単語の重み付けによる方式を採用することとし,tf法,tf-idf法による従来の単語重み付け方式と異なる,df法による単語の重み付け方式を新たに提案する.実験評価の結果,新しく提案したdf法が一番高い精度,再現率となったが,文の長さも重要な情報であり縮約を行う際に考慮すべきであることもわかった.そこで,単語の重みに文長を複合させた縮約方式を提案し,前述の3つの重み付け方式に文長を複合させて実験評価を行った.その結果,dfと文長の組み合わせによる複合型抄録縮約方式の精度,再現率が最高値となることを確認できた.今後の課題として,他の文書集合への適応を検討している.
2002-05-23