オープンソースを利用した共出現単語情報データベース構築の試み
スポンサーリンク
概要
- 論文の詳細を見る
文書を主たる対象とする検索システムには、検索者からいくつかの検索語を受け取り、システム側であらかじめ作成しておいたインデックスを利用して、その語を含む「情報」を検索結果として返すものが多い。このようなシステムでは、網羅性は高いが、検索者が求めていない不必要な情報までも大量に拾い出す傾向にあることが指摘されている。その欠点を補うためには、検索者に適切な検索語(索引語)を選択させたり、大量に返される情報から絞り込みを行えるような検索支援方法をシステム側で用意しておかねばならない。そのような検索支援方法の一つとして、検索者が入力した検索語と共によく使われている語の一覧を表示して、絞り込みを支援する方法が考えられている。本論文は、著名なオープンソースソフトウェア"Namazu"を用いて、そのような検索支援システムに必要な単語間の共出現頻度を計算し、データベース化する試みについて述べたものである。
- 奈良産業大学の論文
- 2002-12-25
著者
関連論文
- 紹介 オープンソースを用いた主題語とNDCカテゴリの統合による図書主題検索システムの開発
- 「教育の情報化」におけるGPSとWebGISの利用
- 新聞にみる政府広報の変遷(1976-1989年度)
- オープンソースを利用した共出現単語情報データベース構築の試み
- 解説 オープンソースによる簡易WebOPACの開発--全文検索ソフトNamazuの応用