首页> 中文学位 >基于大数据平台的知识图谱存储访问系统的设计与实现
【6h】

基于大数据平台的知识图谱存储访问系统的设计与实现

代理获取

目录

第一个书签之前

展开▼

摘要

语义知识图谱广泛应用于搜索、问答和分析等场景,需要可扩展存储模式和分布并行查询支撑。本文在Big Table模型下设计具有存储负载分布均衡、局部节点聚集存储特点的分布聚集存储模式;采用Group-By模式分布并行计算查询树的分布并行查询引擎。实验验证,本文设计的存储模式和查询引擎具有良好的水平扩展性。具体工作总结如下: (1)分布聚集存储模式:基于Big Table模型对逐行存储的实体集合经随机前缀和预分区操作进行均匀分割和分布存储,实现负载均衡;同时,随机前缀也能够对同类型的实体均匀地分布到节点存储,并在单个节点上按实体类别聚集。 (2)分布并行查询引擎:基于分布聚集存储模式设计两种采用不同方案的分布并行查询引擎:MIQE(Memory Iteration Query Engine)和IIQE(Inverted Index Query Engine)。MIQE采用分布式内存迭代技术以过滤和连接操作并行查询在内存中以抽象集合表示的实体,IIQE将倒排索引与协处理器结合在集群中以并行索引查询的方式查询实体。上述两种查询引擎都旨在通过减少磁盘I/O和并行查询的方式提升知识图谱系统的读性能,加快知识图谱查询速度。 (3)原型系统的实现和性能验证:基于上述研究,本文设计并实现基于大数据平台的知识图谱存储访问系统。实验验证,基于分布聚集存储模式和分布并行查询引擎的知识图谱存储访问系统具有良好的水平扩展性,面对大规模知识图谱查询,IIQE查询引擎的查询性能更加优异。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号