Margin-Based Pivot Selection for Similarity Search Indexes
スポンサーリンク
概要
- 論文の詳細を見る
When developing an index for a similarity search in metric spaces, how to divide the space for effective search pruning is a fundamental issue. We present Maximal Metric Margin Partitioning (MMMP), a partitioning scheme for similarity search indexes. MMMP divides the data based on its distribution pattern, especially for the boundaries of clusters. A partitioning boundary created by MMMP is likely to be located in a sparse area between clusters. Moreover, the partitioning boundary is at maximum distances from the two cluster edges. We also present an indexing scheme, named the MMMP-Index, which uses MMMP and pivot filtering. The MMMP-Index can prune many objects that are not relevant to a query, and it reduces the query execution cost. Our experimental results show that MMMP effectively indexes clustered data and reduces the search cost. For clustered data in a vector space, the MMMP-Index reduces the computational cost to less than two thirds that of comparable schemes.
- (社)電子情報通信学会の論文
- 2010-06-01
著者
-
深川 大路
国立情報学研究所
-
深川 大路
National Institute of Informatics
-
TAKASU Atsuhiro
National Institute of Informatics
-
Takasu Atsuhiro
National Center For Science Information Systems
-
Adachi Jun
National Institute Of Informatics
-
KURASAWA Hisashi
Graduate School of Information Science and Technology, The University of Tokyo
-
FUKAGAWA Daiji
Graduate School of Information Science and Technology, The University of Tokyo
-
Fukagawa Daiji
Graduate School Of Information Science And Technology The University Of Tokyo
-
Daiji Fukagawa
Faculty Of Culture And Information Science Doshisha University
-
深川 大路
同志社大学文化情報学部
-
Kurasawa Hisashi
Graduate School Of Information Science And Technology The University Of Tokyo
-
Adachi Jun
National Center For Science And Information Systems
関連論文
- 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム
- マージン最大化によるメトリック空間分割手法(一般,「ユビキタス,センサ環境におけるデータベース」,及び一般)
- 学術情報の統合に向けた大規模リンケージ基盤の構築
- 3.アカデミックリンケージ : 膨大な学術情報へのアクセスを支援するリンケージ基盤(パートII:情報分野研究者のためのオンリーワン共有イノベーションプラットフォーム,情報爆発時代におけるわくわくするITの創出を目指して)
- 高さの制限された2個の無順序木に対する最大共通部分木の近似アルゴリズムの改良
- 2J-3 確率モデルに基づく木の類似度のパラメータ学習について(情報爆発時代におけるマルチメディアデータと交通情報システム,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- Statistical learning algorithm for tree similarity (特集「知識発見の諸科学への応用」および一般)
- 木の編集距離の文字列の編集距離による近似
- 特徴ベクトルからの化学構造の推定(Bioinformatics)
- パス頻度ベクトルからのグラフ推定問題の困難性について
- 類似度の高い無順序木の比較に対する高速アルゴリズム
- ブール関数推定のための貪欲アルゴリズムの性能解析
- 無順序木の編集距離計算のための厳密アルゴリズム
- A clique-based method for the edit distance between unordered trees (特集 「脳科学と知識処理」および一般)
- パス頻度ベクトルからのグラフ推定問題の困難性について
- D-008 類似検索の高速化を目的としたPivot選択手法の実験評価(D分野:データベース,一般論文)
- 2K-2 索引木の均衡を考慮した類似検索索引手法(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2K-1 高さ制約付き無順序木の高速類似検索アルゴリズムについて(情報爆発時代におけるアルゴリズム高率化,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- Probabilistic Automaton-Based Fuzzy English-Text Retrieval(Software Systems)
- Load Balancing Scheme on the Basis of Huffman Coding for P2P Information Retrieval
- Special Section on Information Processing Technology for Web Utilization
- A Minimum Path Decomposition of the Hasse Diagram for Testing the Consistency of Functional Dependencies
- An Improved Clique-Based Method for Computing Edit Distance between Rooted Unordered Trees
- TCGにおけるシャッフル手法に関する計算機実験を用いた考察
- Margin-Based Pivot Selection for Similarity Search Indexes
- The 2nd International Conference on Japanese Information in Science, Technology, and Commerce
- Optimal Pivot Selection Method Based on the Partition and the Pruning Effect for Metric Space Indexes
- Comparison of Electrochemical Impedance Spectroscopy between Illumination and Dark Conditions
- 無順序木の編集距離の指数時間厳密アルゴリズム
- 無順序木の編集距離の指数時間厳密アルゴリズム
- 無順序木の編集距離の指数時間厳密アルゴリズム