Optimal Pivot Selection Method Based on the Partition and the Pruning Effect for Metric Space Indexes
スポンサーリンク
概要
- 論文の詳細を見る
This paper proposes a new method to reduce the cost of nearest neighbor searches in metric spaces. Many similarity search indexes recursively divide a region into subregions by using pivots, and construct a tree-structured index. Most of recently developed indexes focus on pruning objects and do not pay much attention to the tree balancing. As a result, indexes having imbalanced tree-structure may be constructed and the search cost is degraded. We propose a similarity search index called the Partitioning Capacity (PC) Tree. It selects the optimal pivot in terms of the PC that quantifies the balance of the regions partitioned by a pivot as well as the estimated effectiveness of the search pruning by the pivot. As a result, PCTree reduces the search cost for various data distributions. We experimentally compared PCTree with four indexes using synthetic data and five real datasets. The experimental results shows that the PCTree successfully reduces the search cost.
- (社)電子情報通信学会の論文
- 2011-03-01
著者
-
深川 大路
国立情報学研究所
-
深川 大路
National Institute of Informatics
-
TAKASU Atsuhiro
National Institute of Informatics
-
Takasu Atsuhiro
National Center For Science Information Systems
-
Adachi Jun
National Institute Of Informatics
-
KURASAWA Hisashi
Graduate School of Information Science and Technology, The University of Tokyo
-
Fukagawa Daiji
Graduate School Of Information Science And Technology The University Of Tokyo
-
Daiji Fukagawa
Faculty Of Culture And Information Science Doshisha University
-
深川 大路
同志社大学文化情報学部
-
Kurasawa Hisashi
Graduate School Of Information Science And Technology The University Of Tokyo
-
Adachi Jun
National Center For Science And Information Systems
-
FUKAGAWA Daiji
Faculty of Culture and Information Science, Doshisha University
-
Fukagawa Daiji
Faculty Of Culture And Information Science Doshisha University
関連論文
- 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム
- マージン最大化によるメトリック空間分割手法(一般,「ユビキタス,センサ環境におけるデータベース」,及び一般)
- 学術情報の統合に向けた大規模リンケージ基盤の構築
- 3.アカデミックリンケージ : 膨大な学術情報へのアクセスを支援するリンケージ基盤(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- 高さの制限された2個の無順序木に対する最大共通部分木の近似アルゴリズムの改良
- 2J-3 確率モデルに基づく木の類似度のパラメータ学習について(情報爆発時代におけるマルチメディアデータと交通情報システム,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Statistical learning algorithm for tree similarity (特集「知識発見の諸科学への応用」および一般)
- 木の編集距離の文字列の編集距離による近似
- 特徴ベクトルからの化学構造の推定(Bioinformatics)
- パス頻度ベクトルからのグラフ推定問題の困難性について
- 類似度の高い無順序木の比較に対する高速アルゴリズム
- ブール関数推定のための貪欲アルゴリズムの性能解析
- 無順序木の編集距離計算のための厳密アルゴリズム
- A clique-based method for the edit distance between unordered trees (特集 「脳科学と知識処理」および一般)
- パス頻度ベクトルからのグラフ推定問題の困難性について
- D-008 類似検索の高速化を目的としたPivot選択手法の実験評価(D分野:データベース,一般論文)
- 2K-2 索引木の均衡を考慮した類似検索索引手法(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2K-1 高さ制約付き無順序木の高速類似検索アルゴリズムについて(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- Probabilistic Automaton-Based Fuzzy English-Text Retrieval(Software Systems)
- Load Balancing Scheme on the Basis of Huffman Coding for P2P Information Retrieval
- Special Section on Information Processing Technology for Web Utilization
- A Minimum Path Decomposition of the Hasse Diagram for Testing the Consistency of Functional Dependencies
- An Improved Clique-Based Method for Computing Edit Distance between Rooted Unordered Trees
- TCGにおけるシャッフル手法に関する計算機実験を用いた考察
- Margin-Based Pivot Selection for Similarity Search Indexes
- The 2nd International Conference on Japanese Information in Science, Technology, and Commerce
- Optimal Pivot Selection Method Based on the Partition and the Pruning Effect for Metric Space Indexes
- Comparison of Electrochemical Impedance Spectroscopy between Illumination and Dark Conditions
- 無順序木の編集距離の指数時間厳密アルゴリズム
- 無順序木の編集距離の指数時間厳密アルゴリズム
- 無順序木の編集距離の指数時間厳密アルゴリズム