大規模テキスト並列検索エンジンRetrievalExpress (2) : 構造化テキスト検索方式
スポンサーリンク
概要
- 論文の詳細を見る
近年, SGMLやMTMLに代表される, 一件のテキスト中に「題」や「1章」等の構成要素をもつ構造化テキストが, インターネット/イントラネット上で頻繁に用いられるようになっている。それにつれて, 特定の構成要素のみを検索対象として指定する検索が, 精度の高い検索を実現する上で, 書要な機能になっている。筆者らは, 検索洩れ・検索ノイズのない高速全文検索方式としてフレキシブル文字列インバージョン法を提案し, さらにインデックスを分割し並列検索を行うことでスケーラビリティの改善を行ってきた。本稿では, フレキシブル文字列インバージョン法をベースとしたゾーン検索機能を中心に全文検索エンジンRetrievalExpressの構造化テキスト検索方式を述べ, その検索性能の評価結果を報告する。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
福島 俊一
NECヒューマンメディア研究所
-
赤峯 享
NECインターネットシステム研究所
-
赤峯 享
NECヒューマンメディア研究所
-
田中 俊行
Nec情報システムズ
-
米山 千美
NECヒューマンメディア研究所
-
清沢 治彦
NECヒューマンメディア研究所
関連論文
- Webページの重要度ファクタに関する一考察
- D-2 Support Vector Machineを用いた地域情報ページの自動分類(Webコンテンツ処理,D.データベース)
- モバイルサーチエンジンWithAirの試作と評価
- モバイルサーチエンジンWithAirの試作と評価
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 4T-3 WWW検索サービスにおけるトレンド語抽出
- 大規模テキスト並列検索エンジンRetrievalExpress (1) : 並列検索方式
- Webページからのタイプ別情報抽出・分類方式
- Webページからのタイプ別情報抽出・分類方式
- 2P-2 近接演算による数値情報検索の精度改善
- 数値情報を用いたテキスト検索方式の提案と評価
- インターネット多角的検索システムOTROS : データベースを用いたクエリ展開方式の提案
- インターネット多角的検索システムOTROS : 数値情報の抽出と検索
- インターネット多角的検索システムOTROS : 全体の概要と構成
- 固有名詞分類属性を利用した情報検索
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 文書タイプ分類による問題解決向きWWW検索システムの開発と評価
- インターネット多角的検索システムOTROS : 構造的特徴量によるタイプ分類と検索
- 日本語全文検索における文字組ベースのランキングの評価
- 高速全文検索システム RetrievalExpress
- 文字ベース凝縮テキストによる全文検索方式の評価
- 大規模テキスト並列検索エンジンRetrievalExpress (2) : 構造化テキスト検索方式
- 高速全文検索のためのフレキシブル文字列インバージョン法(1) 方式概要
- 高速全文検索のためのフレキシブル文字列インバージョン法(2)実装と評価
- 高速全文検索のためのフレキシブル文字列インバージョン法(1)方式概要