テキスト圧縮を用いた全文検索高速化の一手法
スポンサーリンク
概要
- 論文の詳細を見る
近年,テキストデータベースの飛躍的な増加に伴い,インデキシング作業を必要としない,全文検索手法への注目が高まっている。これまで様々な全文検索高速化手法へのアプローチが提案されているが,テキスト蓄積媒体からの読出し速度が,検索処理速度のボトルネックとなっている。これに対し,文献では,Huffman符号を用いた圧縮テキストに対する直接文字列パターン照合手法が提案され,英文テキストに対し圧縮比率60%,検索処理時間比率70%が得られている。しかし,上記手法の問題点として,可変符号長の圧縮コード処理に伴う検索処理量の増加がある。本報告では,圧縮コード長を2バイトに統一する,検索処理量の増加を伴わない高速な圧縮テキスト直接照合手法の提案を行う。
- 一般社団法人情報処理学会の論文
- 1993-09-27
著者
-
黒須 康雄
(株)日立製作所RAIDシステム事業部
-
藤縄 雅章
(株)日立製作所 中央研究所
-
横山 佳弘
(株)日立製作所システム開発研究所
-
井口 博彰
(株)日立製作所システム開発研究所
-
藤縄 雅章
(株)日立製作所ストレージシステム事業部
-
黒須 康雄
(株)日立製作所システム開発研究所
関連論文
- キャッシュメモリと共有メモリをもつディスクアレーの高速化手法(計算機システム)
- 自由語検索のための高速文字列検索方式
- 画像ファイルシステムの高速検索表示
- 画像圧縮伸長の高速化方式
- テキスト圧縮を用いた全文検索高速化の一手法
- 文書画像の傾き角度検出精度の評価
- 知的ファイリングモデルシステムの開発(その4) : 検索効率向上のためのイメージ表示方法
- 知的ファイリングモデルシステムの開発(その2) : 自由語検索における異表記、異表現解消法
- 線分と疑似濃淡の保存を考慮した文書画像の縮小変換法(新世代データベース技術 : インターネット・マルチメディア・モーバイルを中心として)
- 擬似濃淡領域を含む文書画像の倍率変換に関する一手法
- MMR符号の削減手法に関する比較評価