首页> 中文学位 >基于语义的Linked Data大数据关键字检索研究
【6h】

基于语义的Linked Data大数据关键字检索研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1课题的背景

1.2研究目标和主要内容

1.3论文组织结构

第二章 相关工作综述

2.1语义检索系统的现状

2.2语义检索的评估

第三章 分布式倒排索引方案

3.1 RDF文档划分

3.2分布式A-index的实现

3.3分布式T-index的实现

第四章 OntRank排序算法的设计与实现

4.1查询模式

4.2语义因子SF

4.3 OntRank排序算法

第五章 语义关键字检索系统的评测

5.1评测环境

5.2实验设计与结果

第六章 总结与展望

6.1总结

6.2展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

近年来,由于各领域都在持续不断地发布数据,链式数据(Linked Data)的规模愈来愈大,内容愈来愈丰富。如何方便高效地利用语义Web上的数据越来越被人重视,越来越多的研究涉足这一领域。由于传统的信息检索(IR)技术已经不再适用于链式数据上的检索,普通用户很难在链式数据上准确高效地检索自己想要的数据,所以亟需一种新的检索方法来访问链式数据。
  本文提出了一种在链式数据上做语义关键字检索的方法。考虑到系统的可扩展性,基于MapReduce计算框架和Bigtable数据模型提出了两种分布式的倒排索引方案,其中一种是根据链式数据建立的,而另一种是根据本体建立的。而且作为建立本体索引的一个必要组成部分,一种本体编码方案也同时被提出了。基于这些索引方案,又根据BM25F排序模型设计了一个改进的排序算法OntRank。通过分析查询语句得到用户的查询意图,并用一个语义影响因子来表示此查询意图,接着向BM25F排序模型中加入这个语义影响因子,来提高最终排序的结果。本文设计的实验从索引构建时间、响应时间以及所能承受的访问量来评测分布式倒排索引的性能;使用信息检索综合指标评测OntRank排序算法的准确性。
  本文通过语义与信息检索知识的结合,扩展了传统的概率检索模型,该方法既保留了关键字检索的便捷性,又提高了查询准确率,为语义关键字检索工作开辟了新的思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号