首页> 中文期刊>计算机工程 >基于差分编码的RDF分组压缩

基于差分编码的RDF分组压缩

     

摘要

语义网技术的发展使资源描述框架(RDF)的数据量迅速增长,导致其对存储空间与传输带宽的要求不断提高.现有的通用压缩方法和RDF专用压缩方法可以解决该问题,但仍存在数据冗余.为此,提出一种基于差分编码的RDF分组压缩算法.将RDF数据根据连接宾语的谓语组合进行分组,在消除宾语冗余的同时进一步减少谓语冗余.在此基础上,针对分组后得到的主语序列,通过引入差分编码技术进一步优化其存储空间.实验结果显示,与Plain、HDT和HDT++算法相比,该算法在结构化程度低的Archives Hub、Linkedmdb、rdfabout和DBpedia数据集中可获得平均17%的性能提升,在结构化程度高的dbtune数据集中可获得23%的性能提升,表明其对于不同结构化程度的数据集均具有较好的RDF压缩性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号