首页> 中文学位 >基于存储优化模型的RDF数据查询机制研究
【6h】

基于存储优化模型的RDF数据查询机制研究

代理获取

目录

文摘

英文文摘

声明

1 绪论

2 DBLinkQL系统的设计

3 RDF数据存储优化的实现技术

4 查询语言SPARQL的实现技术

5 系统测试与分析

6 总结及展望

致 谢

参考文献

附录LUBM数据集的查询语句

展开▼

摘要

传统的对RDF(Resource Description Framework)数据存储的方法主要采用基于关系数据库方式的三元组表,但由于RDF数据的稀疏性特点,使得这种存储方式的存储空间利用率和查询效率都不高。因此有研究提出了存储模型的优化方法,这些优化方法主要基于对三元组本身的优化存储,没有考虑使用模式空间的信息对存储模型进行优化。SPARQL(Simple Protocol and Query Language)是万维网联盟推荐的RDF数据查询语言,如何在特定的存储模型上高效地支持SPARQL查询逐渐成为研究的热点。
   基于内存的RDF数据存储和查询系统DBLinkQL能够实现高效的SPARQL查询。DBLinkQL首先建立高效的字符串与整形标识符的映射模块,统一将三元组的字符串形式转化为整形标识符来表示,提高存储空间的利用率和查询的效率;其次DBLinkQL提取RDF的模式空间文件中的特定词汇,对这些词汇进行分类,结合垂直分割的思想,对存储结构进行多种形式的优化,进一步的优化了查询的效率。DBLinkQL支持了多种规范描述的RDF数据的导入,并可以将存储模型映射到磁盘中,可以实现内存存储模型的快速重现。DBLinkQL通过对SPARQL查询进行转换和处理,形成底层存储模型可操作的查询图模型,SPARQL查询系统对各种查询操作情况进行了处理,实现了部分支持了SPARQL查询语言;通过对底层存储数据进行统计,建立了查询连接操作的代价模型,并使用贪婪算法实现了SPARQL查询的优化模块,对查询的先后顺序进行了调整,提高了查询的性能。
   通过对查询优化模块进行测试,DBLinkQL存储系统的SPARQL查询优化模块对查询性能有较大的提高。性能测试表明,DBLinkQL的查询平均性能相比Jena Memory和RDF-3X要好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号