高速全文検索システム RetrievalExpress
スポンサーリンク
概要
- 論文の詳細を見る
インターネット/イントラネットの普及や, 新聞・特許・オフィス文書等の電子化を背景として, 大量のテキストを効率良く検索するニーズが高まっている. 対象となるテキストは新しい話題・用語を次々に取り込んで増加し, 幅広い層のユーザが多様な視点から検索することを考えると, テキストをあらかじめ少ないキーワード集合で抽象化しておくアプローチでは限界がある. テキスト全文をそのまま検索対象とし, 大規模なテキスト集合に対する高速・高精度な全文検索システムが望まれている. 筆者らは, 検索洩れ・検索ノイズのない高速全文検索方式としてフレキシブル文字列インバージョン法を提案し,新聞記事と特許公開抄録文に対象とした実験でその高速性を実証した. 本稿では, フレキシブル文字列インバージョン法を組み込んだ高速全文検索システム RetrievalExpress について報告する. まず, 副インバーテッドファイルを導入することで高頻度文字列の検索を高速化したフレキシブル文字列インバージョン法の改良について述べる. 次に, オリジナルのテキストを参照せずに, インバーテッドファイルのみを参照することで実現した近接演算機能, ランキング機能について説明する.
- 1997-03-12
著者
関連論文
- D-2 Support Vector Machineを用いた地域情報ページの自動分類(Webコンテンツ処理,D.データベース)
- モバイルサーチエンジンWithAirの試作と評価
- モバイルサーチエンジンWithAirの試作と評価
- 日本語入力による英文作成支援インタフェース
- 冗長インデクスを用いた OCR テキスト検索システム
- 日本語入力による英文作成支援システム : 辞書学習
- 日本語入力による英文作成支援システム : 長文パターンによる翻訳
- 概念表現を用いた自動通訳システムINTERTALKER
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 4T-3 WWW検索サービスにおけるトレンド語抽出
- 日本語文構造分類ツール
- 大規模テキスト並列検索エンジンRetrievalExpress (1) : 並列検索方式
- 日本語入力による英文作成支援システム : 仮名漢字変換から仮名英語変換へ
- 対話文の英日機械翻訳における日本語待遇表現の生成
- 入力文字列予測表示を導入した日本語文章の入力法
- 日本語生成に於ける対話文脈構造と代名詞省略
- 翻訳機能付きワープロ : 不安と疲れを感じさせないインタフェース
- シソーラスによるクエリー展開を用いた大規模テキスト検索
- 高速全文検索システム RetrievalExpress
- 文字ベース凝縮テキストによる全文検索方式の評価
- 単語共起によるクエリー展開を用いた大規模テキスト検索
- 語順と省略に着目した自然な日本語対話文の生成
- 対訳用例に基づく対話文翻訳における日本語生成方式
- 大規模テキスト並列検索エンジンRetrievalExpress (2) : 構造化テキスト検索方式
- 高速全文検索のためのフレキシブル文字列インバージョン法(1) 方式概要
- 高速全文検索のためのフレキシブル文字列インバージョン法(2)実装と評価
- 高速全文検索のためのフレキシブル文字列インバージョン法(1)方式概要