大規模な構造化文書データベースにおけるインデクシングと検索の手法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、大量の構造化文書に対する検索要求を全文検索エンジンを用いて高速に処理する手法について提案する。本手法では、文書の構造と内容に対して2種類のインデックスを用いる。構造用のインデックスには文書集合の木構造を格納する。内容用のインデックスにはtermとtermが出現するfield IDおよび文書IDを格納する。検索時には、構造用のインデックスを参照し、階層的な構造に関する検索要求を平らな構造に関する検索要求(fieldまたはzone検索)に変換する。実際にXML文書を用いた実験を行ない、大規模な構造化文書データベースにおける本手法の有効性を確認した。
- 一般社団法人情報処理学会の論文
- 2000-03-21
著者
関連論文
- 利用者による調節が可能な高速日本語形態素解析
- セマンティックグループウェアWorkWare++とKnowWho検索への応用(テキストマイニングの応用(1))
- 質問応答事例検索のための談話構造の認定
- サポートセンタ・オペレータの業務スキル自動推定について(AHPほか)
- 大規模XML文書の検索と格納技術の開発
- サポート業務効率化のための分析技術 (特集 研究開発最前線)
- O-016 サポートセンタにおけるオペレータの業務スキル自動推定とシミュレーション(O.情報システム)
- 大規模な構造化文書データベースにおけるインデクシングと検索の手法
- 大規模な構造化文書データベースにおけるインデクシングと検索の手法
- 全文検索エンジン (情報検索の新潮流)
- 全文検索システムによるXML文書の検索 (INFOSTAシンポジウム'99)
- 全文検索システムによるXML文書の検索
- 高速テキスト検索エンジン
- 大容量情報全文検索システム
- 大容量情報全文検索エンジンTeraβ (特集:研究開発最前線--マルチメディア/パ-ソナル/ネットワ-ク時代への対応)