情報フィルタリングのためのブール式と文書構造を利用した検索条件生成と検索精度評価

概要

論文の詳細を見る
本論文では, ブール式および見出し・文・段落などの文書構造を利用した情報フィルタリングのための検索条件生成実験について報告する.検索精度評価には, テストコレクションBMIR-J1およびこれを拡張したものを用いる.第1の実験では, 実際の情報フィルタリングサービスにおいて検索条件の作成経験を持つ人間が, テストコレクションの検索要求および補足説明文を読んで検索条件を作成する.第2の実験では, 人手による検索条件作成の負荷を軽減するために, 検索要求から検索語を抽出し, 検索条件の自動生成を行う.自動生成実験では, 効率重視の観点からブール式を用いる場合と, 精度重視の観点からブール式を用いない場合の2通りを検討し, いずれの場合にも, 文書構造を利用した検索条件がフラットな検索条件に比べて有効であることを示す.特に, ブール式を用いずに自動生成した検索条件では, ブール式を用いて人手で作成した検索条件とほぼ同程度の高い検索精度が実現できる.また, 人手および自動で検索される正解記事集合が相補的であることを示す.
社団法人情報処理学会の論文
1998-11-15