首页> 外文期刊>電子情報通信学会技術研究報告 >Lossless Data Compression via Substring Enumerationのマルコフ情報源に対する最悪冗長度
【24h】

Lossless Data Compression via Substring Enumerationのマルコフ情報源に対する最悪冗長度

机译:通过子串枚举实现无损数据压缩的马尔可夫源的最差冗余

获取原文
获取原文并翻译 | 示例
           

摘要

DubeとBeaudoinはCompression via Substring Enumeration(CSE)と呼ばれるユニバーサル無歪みデータ圧縮法を2010年に提案した.本稿では,k次マルコフ情報源からの任意の個別系列に対してCSE符号化を行った 場合の冗長度の上界について評価する.その結果,CSEの個別最悪冗長度とクラフトの不等式を満たす最適な固定長-可変長符号で達成可能な最悪冗長度の差は,符号化する系列長nに対して,高々log n程度であることを明らかにする.%Dube and Beaudoin proposed a technique of lossless data compression called compression via substring enumeration (CSE) in 2010. This paper evaluates an upper bound of the amount of bits used by the CSE technique to encode any individual string from an unknown member of a known class of fc-th order Markov processes. We compare the worst case maximum redundancy obtained by the CSE technique for any binary string with the least possible value of the worst case maximum redundancy obtained by the best fixed-to-variable length code satisfying the Kraft inequality. We clarify that the difference of the worst case maximum redundancies is at most log n+constant, where n denotes the length of a binary string to be encoded.
机译:Dube和Beaudoin在2010年提出了一种通用的无失真数据压缩方法,称为通过子串枚举(CSE)。在本文中,当对来自k阶Markov源的任意单个序列执行CSE编码时。结果,可以通过满足CSE个体最差冗余度的最佳固定长度可变长度码所能实现的最差最差度冗余与卡夫不等式之间的差由待编码的序列长度n确定。 %Dube和Beaudoin在2010年提出了一种无损数据压缩技术,称为通过子串枚举(CSE)进行压缩。本文评估了所用位数的上限。通过CSE技术对已知fc阶Markov过程类的未知成员中的任何单个字符串进行编码。我们将CSE技术获得的最坏情况下的最大冗余与任何二进制字符串进行比较,并将最坏情况下的值最小由最佳固定长度到可变长度的代码满足卡夫不等式所获得的最大冗余。我们阐明,最坏情况下最大冗余的差异最多为log n +常数,其中n表示要编码的二进制字符串的长度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号