VF符号と算術符号の組合せ手法による圧縮性能の向上について
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,VF 符号に算術符号を組み合わせることで,検索の効率と圧縮率とを保つ方法について議論する.ここで議論する VF 符号とは,分節木と呼ばれる圧縮のための辞書木を用いて元のテキストを可変長のブロックに分割し,各ブロックに固定長の符号語を割り当てることでデータ圧縮を達成する情報源符号化方法である.VF 符号は,近年,パターン照合を高速化することのできるデータ圧縮法として見直されている.VF 符号は,符号語長が固定であるという制限から,分節木が小さいときには圧縮性能が低い.圧縮率を向上させるには分節木を大きくすればよいが,逆にパターン照合時の前処理に時間がかかり全体の検索の速度を低下させてしまう.そこで,VF 符号の出力を,展開が早い他の符号化方法で符号化することで,圧縮率と検索速度の両方を保つ方法が考えられる.本稿では,代表的な VF 符号である Tunstall 符号および VF 符号の中では優れた圧縮性能を持つ STVF 符号に Range Coder を組み合わせた圧縮方法について,その圧縮性能を実験的に評価した.その結果,符号語長が短い場合において,それぞれおよそ 18 〜 20%,7 〜 15% の圧縮率改善が見られた.
- 2010-07-28
著者
関連論文
- 分節木と共有文字列で表現される符号上での効率良い圧縮照合アルゴリズム(アルゴリズム理論,情報検索,情報爆発論文)
- VF符号上における圧縮照合アルゴリズム
- JPEG画像に対する2次元パターンマッチングアルゴリズム(一般セッション1,移動カメラ画像処理におけるパターン認識とメディア理解)
- 分節木と共有文字列で表現される符号上での効率良い圧縮照合アルゴリズム
- D-1-8 部分文字列の出現頻度に基づくVF符号(D-1.コンピュテーション,一般セッション)
- VF符号と算術符号の組合せ手法による圧縮性能の向上について
- VF符号と算術符号の組合せ手法による圧縮性能の向上について
- VF符号と算術符号の組合せ手法による圧縮性能の向上について
- D-28 文字列照合技術に基づくXMLデータ処理(XMLデータ処理,D.データベース)
- 2G-2 圧縮テキストに対する文字列照合のための統一的枠組み
- 2G-1 データ圧縮による文字列照合の高速化
- ウェブ閲覧における効率的なキーワード抽出とその利用
- 4ZK-7 ブラウジング支援のための一覧性の高いキーワードリストの抽出(情報爆発時代におけるテキストデータ処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- プロパティ接尾辞木のオフライン線形時間構築アルゴリズム(構造化文書・XML,データ工学論文)
- D-020 プロパティ接尾辞木 : メタデータ付き系列データのための効率よい索引構造(D分野:データベース)
- プロパティ付き接尾辞木の効率よいオフライン構築について
- LA_002 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム(A分野:モデル・アルゴリズム・プログラミング)
- 図書目録カード画像検索システムの改善 : 扱いやすく柔軟なインタフェースへの移行(画像DB, 夏のデータベースワークショップDBWS2005)
- 図書目録カード画像検索システムの改善 : 扱いやすく柔軟なインタフェースへの移行(画像DB, 夏のデータベースワークショップ2005)
- テキストファイルによる図書目録画像データベースの構築と管理
- <発表論文>RFID技術を用いた図書館自動化への期待 (「ディジタル図書館」ワークショップ第26回)
- RFID技術を用いた図書館自動化への期待
- 仮想的な多重分節木による効率良いAIVF符号
- 仮想的な多重分節木による効率良いAIVF符号
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- 極小出現区間を用いたエピソードマイニングの高速化(データベース・アルゴリズム)
- D-019 ビット並列手法に基づく大規模連続ストリームパターン照合(D分野:データベース)
- 位置情報付き個人コンテンツ分類のための線形HMMを用いたイベントクラスタリング (情報論的学習理論と機械学習)
- 省スペースな線形時間文法圧縮アルゴリズム
- LZW圧縮テキストに対する高速文字列照合アルゴリズム
- STVF符号--頻度刈り込み接尾辞木を用いた効率よいVF符号化
- 効率よいVF符号のためのMDL原理に基づく分節木の訓練手法
- 効率よいVF符号のためのMDL原理に基づく分節木の訓練手法
- LA-007 Arc-annotation付きテキストに対するパターン照合アルゴリズム(A分野:モデル・アルゴリズム・プログラミング)
- 位置情報付き個人コンテンツ分類のための線形HMMを用いたイベントクラスタリング(機械学習応用,テキスト・Webマイニング,一般)
- 1. データストリームのためのマイニング技術(最新!データマイニング手法)
- 誤りを許したVLDCパタン照合アルゴリズム(文字列アルゴリズム)
- 分類階層を考慮したパタン照合アルゴリズム (特集 オントロジー)
- JPEG画像に対する2次元近似パターンマッチング
- 非対称で個体差がある関係データ分析のための機会調整型無限関係モデル (情報論的学習理論と機械学習)
- 共有辞書を用いた効率の良い圧縮アルゴリズム
- 非対称で個体差がある関係データ分析のための機会調整型無限関係モデル(ベイズ統計モデル,統計推理,データベース,一般)
- Hough変換を用いた楽曲構造の境界抽出
- 歌唱者の異なる同一楽曲の検索に適した音楽指紋
- 共有辞書を用いた効率の良い圧縮アルゴリズム(データ処理の効率化,ビッグデータとソーシャルコンピューティング,及び一般)
- A-008 効率よいVF符号化のための分節木を訓練する新手法(アルゴリズム・コンピュテーション(1),A分野:モデル・アルゴリズム・プログラミング)
- 非対称で個体差がある関係データ分析のための機会調整型無限関係モデル