首页> 中文学位 >RDF语义数据存储编码与查询优化研究
【6h】

RDF语义数据存储编码与查询优化研究

代理获取

目录

封面

声明

中文摘要

英文摘要

插图索引

表格索引

缩略语对照表

目录

第一章 绪论

1 .1研究背景与意义

1 .2国内外研究现状

1 .3论文工作内容

1 .4论文组织结构

第二章 基础理论与技术

2 .1语义网基础理论

2 .2知识表示语言

2 .3 RDF查询处理技术

2 .4本章小结

第三章 RDF语义数据的编码模型

3 .1问题分析

3 .2编码模型分析

3 .3 RDF数据编码算法分析

3 .4本章小结

第四章 RDF语义数据的存储与查询

4 .1数据存储设计

4 .2查询引擎总体结构

4 .3查询模块的设计

4 .4本章小结

第五章 实验研究及结果分析

5 .1实验环境与数据

5 .2实验过程

5 .3实验结果分析

5 .4本章小结

第六章 结束语

参考文献

致谢

作者简介

展开▼

摘要

随着语义网研究的深入以及信息抽取技术的进步,近年来RDF语义数据增长迅速,更多复杂的语义数据需要处理与应用。常见的RDF数据集都有上亿的三元组,如何高效地对海量RDF语义数据进行存储与查询,已经成为学术界研究的热点。RDF具有庞大的数据量,现有的RDF存储系统采用的编码方式已经可以大幅度压缩数据,不过大多编码方法不支持数据的增量更新操作。现有的RDF存储系统多采用完备的三元组存储方式,具有较高的查全率,不过在查询效率上还有待提高。作为未来发展的一个重要领域,RDF语义数据的处理还有很多值得研究的方面。本文主要研究的是RDF数据的编码和存储技术。通过分析国内外研究现状,对现有的系统进行大量研究和实验,针对RDF语义数据的编码方式和存储方式提出了改进方法,并运用该方法做了实验与分析。
  本研究主要内容包括:⑴结合RDF语义数据的特点,设计实现了基于哈希的HBRA编码方案。HBRA编码方案采用Hash Lookup算法实现了文本到ID的映射,支持数据的初始化批量加载,也可以实现较快的增量更新操作,满足了RDF数据不断增加的特性。通过在内存中建立冲突处理表、使用Bloom filter查找算法和建立分块索引等策略,提升了编码时数据查找、判重和更新的效率。⑵通过研究RDF的查询处理技术,提出了基于三元组的二级索引存储方法,设计了二级索引的存储结构,实现了相应的存储过程。采用的二级索引结构不仅可以减少RDF数据的存储空间,还可以减少RDF语义数据查询时的比较次数。通过研究查询引擎的总体结构以及查询引擎的查询机理,结合二级索引存储的特点,设计了对应的RDF语义数据查询的处理过程。⑶根据提出的RDF语义数据编码方案和查询策略,对 RDF-3X系统做了改进,并做了相关实验。在编码方面,对数据编码方案进行了功能测试、冲突处理测试。在查询性能方面,选取9个SPARQL查询语句,采用YAGO数据集对几个存储系统做了实验,得到查询的查全率和时间效率。实验表明,使用新的编码方案和存储技术在不影响查全率的基础上,在简单查询和并列查询方面的查询效率有一定的提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号