声明
摘要
插图目录
表格目录
缩略词表
第1章 绪论
1.1 研究背景
1.2 现有解决方法概述
1.2.1 经典的子图匹配算法
1.2.2 与知识图谱相关的查询算法
1.2.3 分布式图数据处理技术
1.3 存在问题与研究思路
1.4 研究目标与内容
1.4.1 研究目标
1.4.2 研究内容
1.5 论文组织
第2章 研究现状
2.1 引言
2.2 图查询技术研究现状
2.3 知识图谱查询研究现状
2.4 分布式大数据处理研究现状
2.5 研究现状总结
第3章 面向知识图谱的Top-k查询模型
3.1 引言
3.2 Top-k子图近似匹配问题
3.2.1 预备知识
3.2.2 近似度的衡量标准
3.3 模型的求解框架
3.3.1 两阶段的求解框架
3.3.2 阶段一:寻找Top-k*候选顶点
3.3.3 阶段二:寻找Top-k图嵌入
3.4 实验与分析
3.4.1 环境与参数设置
3.4.2 查询模型的有效性
3.4.3 与现有算法比较
3.4.4 k*的取值对查询性能的影响
3.5 小结
第4章 基于限界技术的分布式查询算法
4.1 引言
4.2 面向知识图谱查询的限界技术
4.2.1 限界技术概述
4.2.2 关联分值的上下界
4.2.3 算法终止条件
4.2.4 上下界的计算方法
4.2.5 算法正确性分析
4.3 分布式图查询算法的具体实现
4.3.1 实现方案概述
4.3.2 分布式的上下界计算方法
4.3.3 分布式的终止条件检查方法
4.4 实验与分析
4.4.1 运行环境与参数设置
4.4.2 与现有算法的比较
4.4.3 算法的执行性能
4.4.4 算法的可扩展性
4.5 小结
第5章 分布式图查询执行优化技术
5.1 引言
5.2 查询作业调度优化
5.2.1 延迟调度算法及其存在问题
5.2.2 面向图查询的延迟调度算法
5.2.3 数据本地性驱动的图查询任务指派
5.2.4 数据中心负载感知机制
5.2.5 延迟时间自适应调整机制
5.3 数据存储结构优化
5.3.1 数据共享技术
5.3.2 数据存储格式
5.4 实验与结果分析
5.4.1 运行环境与参数设置
5.4.2 调度算法的自适应性
5.4.3 作业的数据本地性
5.4.4 调度算法对查询时间的影响
5.4.5 存储结构对查询时间的影响
5.5 小结
第6章 面向知识图谱的搜索引擎原型系统
6.1 引言
6.2 GStar的总体设计
6.3 GStar功能模块设计与实现
6.3.1 离线数据处理子系统
6.3.2 在线分布式查询子系统
6.4 GStar系统部署与性能测试
6.4.1 GStar的实际部署
6.4.2 DBLP知识图谱和查询用例
6.4.3 GStar功能和性能测试
6.5 小结
第7章 总结与展望
7.1 论文总结
7.2 下一步研究方向
参考文献
致谢
攻读博士期间论文发表情况
攻读博士期间参与的科研项目
作者简介