Valuable LCA探索に用いる索引のデータサイズの削減
スポンサーリンク
概要
- 論文の詳細を見る
XML 文書に対するキーワード検索は利点が多いが,適切な出力部分木を抽出することが重要である.XML タグに出現する語を考慮することで,精度,F 値の面で優れる部分木を抽出する VLCA を根とする手法が提案されている.しかし,これまで提案されている VLCA 探索手法ではキーワードが増えた場合の抽出手法の性能に問題があった.我々は効率的な VLCS 探索のための索引構築手法として BitMapKBSI 法を提案し,性能改善の効果を示している.ただ,これまでの実現方法では索引の容量の面で課題が残っていた.本稿では,索引の容量を削減するために,XM Lノードのシグネチャを用いない方法,シグニチャの重複を除く手法,同一ノードのシグニチャ情報を共有する手法の 3 種類の改善手法を提案し,実験によってその性能および作成する索引データサイズを検証する.
- 2010-07-28
著者
-
横田 治夫
東京工業大学学術国際情報センター
-
横田 治夫
東京工業大学
-
横田 治夫
東京工大 大学院情報理工学研究科
-
横田 治夫
東京工業大学学術国際情報センター:東京工業大学大学院情報理工学研究科
-
小林 径
東京工業大学大学院情報理工学研究科計算工学専攻
-
横田 治夫
東京工業大学学術国際センター|東京工業大学大学院情報理工学研究科計算工学専攻
-
小林 径
東京工業大学 大学院情報理工学研究科 計算工学専攻
関連論文
- 更新処理を考慮したXMLラベルにおける構造情報の抽出手法(構造化文書,XML,情報爆発論文)
- 暗号化データ格納ストレージにおける性能とセキュリティの両立(ストレージ 並列分散データベース,データ工学論文)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- 平文を生成しない分散ストレージ上での再暗号化手法の提案(セッション5c:セキュリティ・プライバシー)
- 講義講演シーン検索におけるレーザポインタ情報の活用法(コンテンツ技術,データ工学論文)
- 1-3. マルチメディアストレージ(1.画像エレクトロニクス,映像情報メディア年報)
- アクセス頻度と容量分散を考慮した版管理用データ配置法の実装と評価(データ工学, ディペンダビリティ, 一般)
- 並列Btree構造における負荷分散処理の並行性制御への影響(高性能システム, 夏のデータベースワークショップDBWS2005)
- 並列Btree構造における負荷分散処理の並行性制御への影響(高性能システム, 夏のデータベースワークショップ2005)