PPM圧縮法における文字列検索(インターネット環境でのデータ工学とディペンダビリティ)
スポンサーリンク
概要
- 論文の詳細を見る
圧縮データに対する高速な文字列検索は圧縮データサイズの増大に伴って重要になっている.この手法は圧縮データにおけるコンピュータウィルス検査も高速化させることが可能であり,圧縮データの安全性を高めることができる.CPM(Compressed Pattern Matching)手法は,圧縮データに対する高速な検索法の一種であり,圧縮データを伸長せずに文字列検索を行う手法である.しかし,文脈を用いて圧縮を行うPPM圧縮法に対するCPM手法はこれまで提案されていない.本稿では,PPM圧縮法に対するCPM手法を提案する.本提案手法は圧縮の際に生成される木の情報を圧縮データに付加する.文字列検索はこの付加情報を検索することによって行う.計算機シミュレーションによる評価の結果,約半数のサンプルファイルおいて,0.1〜5%の圧縮率の増加で,提案手法が実装可能となることが分かった.
- 2006-10-10
著者
関連論文
- PPM圧縮法における文字列検索(インターネット環境でのデータ工学とディペンダビリティ)
- ブロックソート圧縮法に対する誤り回復手法(ホームネットワーク,符号)(データ工学,ディペンダビリティ,一般)
- バースト誤り制御符号に対する並列復号法
- インターネット利用システムにおけるIntegrityの定量的評価(安全性及び一般)
- インターネット利用遠隔システムの信頼性評価法(安全性及び一般)
- 情報家電間の親和性・競合性に基づく連携動作支援手法(HIP一般(2),顔・ジェスチャの認識・理解)
- 情報家電間の親和性・競合性に基づく連携動作支援手法(HIP一般(2),顔・ジェスチャの認識・理解)
- 計算機資源の提供・募集が可能な計算機クラスタ(安全性及び一般)
- 計算機資源の提供・募集が可能な計算機クラスタ
- Wormhole方式を基にしたバックトラック可能な耐故障スイッチング(ディペンダブルソフトウェアとネットワーク)
- D-10-13 一時停止形デッドロック回復の性能評価
- チェックポイント比較方式高信頼計算機クラスタ
- 並列計算機のキャッシュ利用チェックポイント取得
- 並列グラフ簡約にもとづく関数プログラムの耐故障性
- D-10-5 相互結合網のトラヒック分散モデルの提案
- FTS2000-21 一般化階層型完全結合網の諸性質
- ブロックソート圧縮法に対する誤り回復手法(ホームネットワーク,符号)(データ工学,ディペンダビリティ,一般)
- SD-2-7 ディジタルシステム高信頼化のための誤り制御符号
- D-10-12 ユニバーサルデータ圧縮のための入れ子構造誤り制御符号化法の評価
- FTS2000-20 一般化階層型完全結合網のルーティングアルゴリズム
- 2ビット誤り訂正機能を有するバイト誤り制御符号
- Burst Error Recovery in VF Arithmetic Codes
- D-10-11 VF算術符号におけるバースト誤り回復手法
- 算術符号におけるバースト誤り回復手法
- バースト誤り位置指摘符号
- 誤り位置指摘符号の距離構造
- 3段階の保護レベルを有するバイト誤り保護符号
- 誤り位置指摘符号の距離構造
- バイト誤り訂正符号における並列復号法
- SEC-DED機能を有する最適なバイト誤り保護符号
- SEC-DED機能を有する最適なバイト誤り保護符号
- PPM圧縮法における文字列検索(インターネット環境でのデータ工学とディペンダビリティ)
- 複数辞書を用いたデータ圧縮法とその誤り回復
- バースト誤り位置指摘符号の構成とその復号法(ホームネットワーク,符号)(データ工学,ディペンダビリティ,一般)
- バースト誤り位置指摘符号の構成とその復号法(ホームネットワーク,符号)(データ工学,ディペンダビリティ,一般)