適合的ビットデータ化によるニュースストリームデータの圧縮方法の提案
スポンサーリンク
概要
- 論文の詳細を見る
静的ハフマン符号では同じ記号の集合に出現頻度に応じた符号を割り当てることでデータを圧縮する.しかしニューステキストのような連続データでは、次々に流れてくる大量のデータをリアルタイムに処理することが求められている.本研究では、ニューステキストの特性にあわせて適合的に辞書の変更を行い、圧縮するための圧縮符号化方法を提案する.この技法では KL(Kullback-Leibler) 情報量によりニューステキストの分布の変化を調べることにより、チャンクの区切りを作成する.本報告では、静的圧縮及び動的圧縮方法と比較し、その特徴および実験による性能を論じる.
- 2012-03-19