WWW 検索のための情報収集技術の開発
スポンサーリンク
概要
- 論文の詳細を見る
近年のインターネットでの WWW(World Wide Web)の発展はめざましいものがあり,それに伴い WWW 情報の検索サービスが必要となっている. そこで, 我々はこのサービスを実現するための検索システムを開発した. このWWW 情報検索システムは大きく分けて情報収集技術と検索技術により実現されている. 本稿では, そのうちの情報収集技術について報告する. WWW に提供されている情報の量は爆発的に増え, どこに何があるかを知るための検索サービスが多数(Lycos, Yahoo 等)出現した. これらのサービスは多くのユーザーにとって便利だが, WWW 全体の情報量が増えてくるにつれ, 以下のような問題がでてきた. (1)検索に工夫が必要 検索に対するヒット数か多すぎる. 陳腐語では何の情報も得られない位だが, 逆に絞込みに多項間論理積をとると, 何もヒットしなくなることも多い.(2)データ更新を捕捉できない 検索した結果みつかった URL が既に移動・消滅しており, 情報かなくなっている場合が多々ある. これらの問題は収録情報のボリュームと雑多性に起因するといえ, 解決するには検索対象を特定のものに絞り収集情報の量を適切なレベルに抑制, WWW サーバの頻繁なデータ更新に機敏に対応する必要がある. そこで収集情報を特定内容のものに限定し, 更新収集を効率的に行う等の特長を持つ情報収集 S/W(ロボット)を開発した.
- 一般社団法人情報処理学会の論文
- 1997-03-12