声明
摘要
第1章 绪论
1.1 课题研究的背景和意义
1.2 研究现状
1.3 本文的主要工作
1.4 本文的结构安排
第2章 基础理论与相关知识
2.1 RDF与SPARQL相关知识
2.1.1 RDF
2.1.2 SPARQL
2.2 并行化编程模型及优化技术
2.2.1 并行化编程模型-MapReduce简介
2.2.2 MapReduce编程理念和原理
2.3 分布式实验平台概述
2.3.1 Hbase概述
2.3.2 Spark概述
2.4 本章小结
第3章 系统构架
3.1 系统总体构架
3.2 HBase存储模块
3.2.1 RDF存储模型概述
3.2.2 HBase下的RDF存储分析
3.2.3 HBase下的RDF存储模型的定义
3.3 查询模块
3.3.1 SPARQL查询解析
3.3.2 SPARQL top-k查询
3.3.3 查询计划
3.4 本章小结
第4章 基于Spark的Top-k查询算法
4.1 Top-k查询问题概述
4.1.1 查询模式的划分
4.1.2 排名函数特点的划分
4.1.3 数据访问方式的划分
4.2 top-k查询算法概述
4.3 Spark下的Top-k查询方案
4.3.1 STA算法
4.3.2 SSJA算法
4.4 Spark下查询方案的实现
4.5 本章小结
第5章 实验方案结果与分析
5.1 实验环境
5.2 实验数据集
5.3 实验结果与分析
第6章 总结与展望
6.1 工作总结
6.2 工作展望
致谢
参考文献
附录1 攻读硕士学位期间发表的论文