- 論文の詳細を見る
This paper surveys some universal codes for text compression from a unifying viewpoint. As is well known in information theory, the data compression limit of a source is given by its entropy rate. Since universal codes are designed to work with an arbitrary source distribution, they can be expected to serve as entropy estimators. In order to reveal the capability of estimating the entropy, we introduce the notion of a context table, in which all the substrings in a text are enumerated in lexicographic order. A context table is useful to intuitively understand several important quantities including the recurrence time of a substring, the conditional recurrence time, and the length of the shortest unique substring. In terms of these quantities we characterize the Ziv-Lempel code and sort-based symbol ranking codes. Some relations among these apparently independent codes are established by the help of context table concepts.
- 日本応用数理学会の論文
- 1998-06-15
- クエリログから獲得した関連語のクラスタリングに基づくWeb検索(Web検索,データ工学論文)
- ユニバーサル無ひずみデータ埋め込みのための一般化LSBデータ埋め込みモデル(情報通信基礎サブソサイエティ合同研究会)
- AS-3-2 1次元無ひずみデータ埋め込みに要求されるホストデータ長について(招待講演,AS-3.情報ハイディングの理論と技術,シンポジウム)
- 再帰時間符号化法の冗長性削減のための諸手法の相互関係
- 原画像の無ひずみ再現可能な情報埋め込み法の埋め込み容量の改善
- ユニバーサル無ひずみデータ埋め込みのための漸近最良法
- 再帰時間符号化データ圧縮法における情報埋込み(情報理論)
- 情報埋め込みをともなう無ひずみ圧縮
- 情報秘匿のためのCPT法の濃淡画像への応用
- データ圧縮における最新アルゴリズム [III] : ソートによるデータ圧縮
- 適応的アルファベット分解を用いた無ひずみデータ圧縮
- データ圧縮の基礎 : ディジタルデータのロスなし圧縮
- 情報と符号化の数理, 韓太舜, 小林欣吾(共著), "情報と符号化の数理", 培風館(1999-10), A5判, 定価(本体4, 500円+税)
- TA-2-2 文脈ソーティングによる無歪みデータ圧縮とその周辺
- 文脈参照機能を導入した非統計型ユニバーサル符号について
- テキスト圧縮のためのユニバーサル符号(データ圧縮)
- ブロックソートデータ圧縮法に関する考察
- AVL 木を利用した適応的数値データ圧縮法とその改良
- ユニバーサル無ひずみデータ埋め込みのための一般化LSBデータ埋め込みモデル(情報通信基礎サブソサイエティ合同研究会)
- ユニバーサル無ひずみデータ埋め込みのための一般化LSBデータ埋め込みモデル(情報通信基礎サブソサイエティ合同研究会)
- 情報検索とデータ圧縮とを統合したシステムmgの日本語化
- 記号列の長さと位置との関係をポインタ符号化に利用したZiv-Lempel符号
- 文脈ソーティングによるテキスト圧縮
- 日本語理解システムのための視点抽出と照応解決
- 適応的データ圧縮の最近の技法
- TB-3-4 非 LZ 系無ひずみ情報源符号化法の潮流
- 数値データ圧縮のための適応的符号化法
- 視点と焦点の関係に基づく日本語談話の照応解決
- 日本語係り受け解析のための主題化にかかわる基礎原則
- 実時間パターン照合によるデータ圧縮の高性能実用算法