テキストデータベースのための文字成分表によるプリサーチ

スポンサーリンク

概要

論文の詳細を見る
大量のテキストを検索対象とするテキストデータベースシステムでは、二次記憶のデータ転送速度がボトルネックになり十分な検索速度を得ることができない。そこで、ディスクアクセスの少ない処理により対象となるテキストを絞り込んだ後、詳細な検索処理をすると、高速な検索を実現することが可能となる。このような方法としてテキスト及び検索パターンの特徴ビット列表現のマッチングによるシグネチャ法や文字成分表と凝縮文書を利用してテキストを絞り込む方法がある。私達は大容量のテキストデータを対象として登録テキストから自動的にキーワードを抽出し、さらにそのキーワードを基に検索語に対して検索テキストの得点付けを行い検索するテキストデータベースを開発している。本システムにおいても、検索の高速化のためにテキスト得点付けの前にテキストを絞り込むプリサーチを行う。本稿では、このプリサーチについて述べる。
一般社団法人情報処理学会の論文
1992-09-28

著者

関連論文

もっと見る

スポンサーリンク