首页> 中文期刊> 《软件学报》 >大规模RDF图数据上高效率分布式查询处理

大规模RDF图数据上高效率分布式查询处理

         

摘要

知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resource description framework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模PDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致MapReduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮MapReduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQL BGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量级,且优化算法的查询时间与基本算法相比缩短了49.63%~78.71%.

著录项

  • 来源
    《软件学报》 |2019年第3期|498-514|共17页
  • 作者单位

    天津大学智能与计算学部;

    天津300354;

    天津市认知计算与应用重点实验室;

    天津300354;

    天津大学智能与计算学部;

    天津300354;

    天津市认知计算与应用重点实验室;

    天津300354;

    天津大学智能与计算学部;

    天津300354;

    天津市认知计算与应用重点实验室;

    天津300354;

    天津大学智能与计算学部;

    天津300354;

    天津市认知计算与应用重点实验室;

    天津300354;

    数字出版技术国家重点实验室;

    北京100871;

    中国人民大学信息学院;

    北京 100872;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    星形分解; 分布式; 基本图模式匹配; 大规模RDF图; MapReduce;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号