全文検索のためのパトリシア構造化シグネチャファイルのテキストデータベース上での実現
スポンサーリンク
概要
- 論文の詳細を見る
全文検索を高速に行うためのインデックスであるシグネチャファイルは, 他の全文検索用インデックスに比べサイズが小さいとい利点がある。シグネチャファイルの問題点は, 全文検索におけるシグネチャファイル走査コストがテキスト数に比例することである。この走査コストを削減するために, いくつかのシグネチャファイル分割法が提案されてきた。これらの研究は, シグネチャファイルを分割格納し, 検索時におけるディスクI/Oコストの削減を目的とするものである。しかし, メモリの大容量化により, シグネチャファイル全体をメモリ上に置くことが可能になりつつある。そこで, 我々はメモリ上におけるシグネチャファイルによる全文検索コストの削減を目的に, ビットデータ用データ構造であるパトリシア構造のシグネチャファイルを提案した。本稿では, パトリシア構造化シグネチャファイルと, 分割シグネチャファイルであるビットスライスドシグネチャファイルを, 実メモリ上に作成し, 検索コストの比較を行った。実験の結果, シグネチャファイルによる全文検索の後処理に要するコストを考慮すると, パトリシア構造化シグネチャファイルは, 検索文字列が多い場合に有効であり, 検索文字列が少ない場合には, 2つのシグネチャファイルの走査コストの差は全検索コストから見ると小さいことが分かった。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
金子 邦彦
九州大学・大学院システム情報科学研究院
-
金子 邦彦
九州大学大学院システム情報科学研究院
-
牧之内 顕文
九州大学大学院システム情報科学研究院
-
権藤 夏男
九州大学大学院システム情報科学研究科
-
牧之内 顕文
九州大学大学院
関連論文
- 市街地景観再現のための3次元実世界データベースシステムの検討(画像/三次元データ,e-Science及びData Intensive Science)
- 日本人成人男性の全身CT画像と全身MRI画像の位置合わせ(画像/三次元データ,e-Science及びData Intensive Science)
- 緊密な産学連携に基づく自律的なICT人材育成の実践(情報システム教育コンテスト(3))
- 空間データモデルCell Complexの空間データベースシステム格納法
- Extended Cell Splitting Algorithmの効果的な実装(空間データ, 夏のデータベースワークショップDBWS2005)
- Extended Cell Splitting Algorithmの効果的な実装(空間データ, 夏のデータベースワークショップ2005)
- 空間データベースのための拡張超平面分割アルゴリズム(空間DB)(夏のデータベースワークショップDBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eye のデータの圧縮(空間DB)(夏のデータベースワークショップDBWS2004)
- 空間データベースのための拡張超平面分割アルゴリズム(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eyeのデータの圧縮(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 空間データベースのための凸領域分割アルゴリズムの拡張
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eye のデータの圧縮(空間DB)(夏のデータベースワークショップDBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eyeのデータの圧縮(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- E24 3次元コンピュータグラフィックスを用いたデジタルヒューマン表現 : 病を知るためのデジタルコンテンツ(デザイン教育、CG,口頭による研究発表概要,平成18年度 日本デザイン学会 第53回研究発表大会)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eye のデータの圧縮(空間DB)(夏のデータベースワークショップDBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eyeのデータの圧縮(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eye のデータの圧縮(空間DB)(夏のデータベースワークショップDBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eyeのデータの圧縮(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eye のデータの圧縮(空間DB)(夏のデータベースワークショップDBWS2004)
- 符号ベクトルに基礎を置く空間データベースシステムHawk's Eyeのデータの圧縮(セッション5C : 空間DB)(夏のデータベースワークショップ : DBWS2004)
- 属性文法の変換の閉包性に基づくオブジェクトデータモデルのメソッド合成
- 時制制約に従うオブジェクトマイグレーションとその振舞いモデリング
- 関係データベース管理システムRDB/V1
- 自己組織化特徴マップに基づいた類似画像検索システムの設計・実装と性能評価
- デザインパターン利用支援システムのソースコード生成支援
- デザインパターンのSGMLに基づく構造化文書化とその閲覧
- SGMLに基づくデザインパターン利用支援システムのユーザインターフェース
- オブジェクト指向ソフトウェア部品の分散管理システム
- ソフトウェア部品リポジトリへのデザインパターン導入の試み
- 4次元空間データベースシステム Hawks における4次元空間表現
- 4次元空間データベースシステムHawksにおける4次元空間データ型の設計 (時空間データベース)
- 時空間データベースUniverseにおける物体表現
- パネル討論会 : 永続的プログラミング言語とオブジェクト指向データベース : 第85回データベースシステム研究会 第4回プログラミング : 言語・基礎・実践 研究会 合同報告
- オブジェクトデータベースのための対話的可視化システム
- 「病を知るディジタルヒューマン」のための歩行実験データのデータベース設計(医療,夏のデータベースワークショップDBWS 2006)
- 「病を知るディジタルヒューマン」のための歩行実験データのデータベース設計(医療)
- 「病を知るディジタルヒューマン」のための歩行実験データのデータベース設計
- 「病を知るディジタルヒューマン」のためのデータベース設計(セッション6: データベース一般)
- 「病を知るディジタルヒューマン」のためのデータベース設計(セッション6: データベース一般)
- リレーショナルデータベースにマッピングされたXMLドキュメント : XMarkに対するXPath問い合わせ実験の試み(セッション4:XML)
- リレーショナルデータベースにマッピングされたXMLドキュメント : XMarkに対するXPath問い合わせ実験の試み(セッション4:XML)
- オブジェクト指向型マルチメディア知識ベースJasmineのプログラムインタフェースの実現について
- オブジェクト指向型マルチメディア知識ベースJasmineのモデルと操作言語について
- 新提案NSBR^*-tree : 構築と検索
- DT-2-1 病を知るディジタルヒューマン : 目標と現状(DT-2.知的デジタルアトラス,チュートリアル講演,ソサイエティ企画)
- 時空間データベースシステムHawksのR^*-treeによる領域検索の高速化
- 拡張凸胞複体を基盤とする空間データ表現モデルとその地理情報データベースへの応用
- 4H-2 代表スライス法による全身CT画像と全身MRA画像の粘性流体位置合わせの省力化(医療分野への応用(3),一般セッション,コンピュータと人間社会)
- 粘性流体位置合わせを用いた複数の3次元人体地図の統合手法の提案(医用情報処理)
- 粘性流体位置合わせを用いた複数の3次元人体地図の統合手法の提案(医用情報処理)
- H_022 3次元医用画像セグメンテーションにおける心臓モデルの局所変形法(H分野:生体情報科学)
- H_015 三次元生体医用カラー画像からのwatershed法による臓器領域抽出の実験(H分野:生体情報科学)
- XMLによるDICOMデータセットの記述(医療,夏のデータベースワークショップDBWS 2006)
- XMLによるDICOMデータセットの記述(医療)
- 三角ポリゴンモデルを利用したCT画像からの心臓領域抽出の試み
- 3次元人体カラー画像からの半自動による肺領域抽出
- 三角ポリゴンモデルを利用したCT画像からの心臓領域抽出の試み
- 空間データベースシステムHawk Eye における接続グラフに基礎を置く凸胞複体2項空間演算処理方式
- MPEG ビデオデータベースにおけるビデオ格納構造
- オブジェクトデータベース「出世魚」のODMG対応
- A Uniform Visual-Spatio-Temporal Model for Indexing and Retrieving Videos.
- New Indexing Method for Content-Based Video Retrieval and Clustering for MPEG Video Database
- Webベースの表形式フォームシステムでのYAMLフォーム構造記述からのフォーム自動生成
- データベースシステム「出世魚」上でのパトリシア構造化シグネチャファイルの実現と評価
- 全文検索のためのパトリシア構造化シグネチャファイルのテキストデータベース上での実現
- ファイルマップを特徴とした構造化テキストデータベースのデータ格納と質問言語
- 高速テキスト検索のためのパトリシアトライ構造化シグネチャファイル
- 高速テキスト検索のためのパトリシアトライ構造化シグネチャファイル
- Wavelet-SOMに基づいた類似画像検索システムの設計・実装と性能評価(:ビジュアルデータベース)
- 表情認知科学実験データベースの設計と構築(セッション9C : 応用・事例2)(夏のデータベースワークショップ : DBWS2004)
- 空間データベースシステムHawksにおける演算子の設計
- 拡張SEQUOIA2000ベンチマークを使った分散並列オブジェクトデータベースシステム「出世魚」の並列処理性能評価
- 空間データベースのための視点移動型可視化インターフェイスの実装と地理データベースへの適用
- 空間データベースのための視点移動型可視化インターフェイスの実装と地理データベースへの適用
- 異機種分散環境で動作するデータベースサーバ「出世魚」とその実現
- 自己組織化マップに基づく類似画像検索の高速化手法
- 4K-4 ページレベルロックとオブジェクトレベルロックの混在を許す分散データベースロック方式の実現
- 永続分散共有メモリ機能を提供するデータベースサーバ : 「わかし」のマルチメディア拡張
- オブジェクト指向データベースシステム「出世魚」におけるビデオ・音声の同期機構
- MPEGビデオデータベースのデータ格納方式
- 双方向予測マクロブロックの率を利用したMPEGビデオカット検出法の実装・評価・改良
- 分散共有永続メモリサーバ「わかし」のトランザクション管理
- 分散共有永続メモリサーバ「わかし」のトランザクション管理
- 表情認知科学実験データベースの設計と構築(応用・事例2)(夏のデータベースワークショップDBWS2004)
- ラウンドロビン分割法による分散地理データベースにおける並列Spatial Joinの高速化
- Implicit LockとExplicit Lockの混在を許すオブジェクトデータベース管理システム「出世魚」におけるページロックメカニズム
- 分散並列オブジェクトデータベースシステム「出世魚」におけるDistributed Wait Depth Limited デッドロック回避法の実装
- データベースサーバ「わかし」上へのログ, リカバリ, 2相コミットの実装
- 並列オブジェクトデータベース「出世魚」における並列R-treeの探索アルゴリズムの実装と性能評価
- 出世魚の64ビット化とその上でのセコイヤ2000ベンチマークデータベース
- 出世魚の64ビット化とその上でのセコイヤ2000ベンチマークデータベース
- Extending Database Space of Inada/ODMG for Very Large Databases on 64 Bit Workstations
- 最小支持度を変えて繰返し実行する場合に有効なラージアイテム集合摘出アルゴリズム
- 超平面アレンジメントに基づく多次元空間幾何アルゴリズムの実装と評価(セッション4B : アルゴリズム・索引)
- 超平面アレンジメントに基づく多次元空間幾何アルゴリズムの実装と評価(アルゴリズム・索引)(「夏のデータベースワークショップ(DBWS2003)」一般)
- オブジェクトデータベースのための多粒度ロック方式の検討
- 永続分散共有メモリ機能を提供するデータベースサーバ「わかし」の64ビットアーキテクチャ上での実現
- 分散並列永続プログラミング言語「出世魚」における分散並列処理メカニズム
- E-004 モバイル機器用チューナアプリケーションの開発を通したAIRとC言語ライブラリの連携(音楽情報科学(1),E分野:自然言語・音声・音楽)
- マルチメディアデータベース : 現状と課題