首页> 中文期刊> 《通信学报》 >HitIct:中文无损压缩算法性能评估测试集

HitIct:中文无损压缩算法性能评估测试集

         

摘要

提出了一个基于ANSI编码的中文无损压缩算法性能评估测试集HitIct.按照应用代表性、对现有ASCII编码测试集的补充性、样本公开性的原则从互联网上获取候选样本集,采用平均压缩率、标准差、平均相关系数、压缩率相关系数等技术指标对样本集中的样本进行筛选,并剔除影响压缩率的非文本因素等方法确定的最佳样本组成HitIct Corpus.实验结果表明,该测试集具有良好的代表性及稳定性,可以作为当前主流ASCII编码测试集的补充.

著录项

  • 来源
    《通信学报》 |2009年第3期|42-47|共6页
  • 作者单位

    哈尔滨工业大学,计算机网络与信息安全技术研究中心,黑龙江,哈尔滨,150001;

    中国科学院,计算技术研究所,信息智能与信息安全研究中心,北京,100190;

    哈尔滨工业大学,计算机网络与信息安全技术研究中心,黑龙江,哈尔滨,150001;

    中国科学院,计算技术研究所,信息智能与信息安全研究中心,北京,100190;

    中国科学院,计算技术研究所,信息智能与信息安全研究中心,北京,100190;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 数据备份与恢复;
  • 关键词

    数据压缩; 测试集; 无损压缩;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号