首页> 中文学位 >基于个性化本体的语义搜索引擎技术的研究与设计
【6h】

基于个性化本体的语义搜索引擎技术的研究与设计

代理获取

目录

文摘

英文文摘

声明

第一章绪论

第二章搜索引擎原理及现状分析

第三章基于语义的搜索引擎技术

第四章基于个性化本体的语义搜索引擎的研究与设计

第五章总结与展望

参考文献

致谢

展开▼

摘要

随着网络的普及和飞速发展,网上信息以指数的形式增长。这些海量信息在给人们带来丰富资源的同时,也给人们对如何有效地获取和使用这些信息带来了巨大的挑战。传统搜索引擎在一定程度上缓解了这一矛盾,然而,由于其无法理解这些信息的语义,导致它的检索质量和效果远远无法令人满意,其查全率和查准率还有待提高。语义搜索引擎将检索策略从传统的关键词层面上升到语义层面,结合智能推理技术,改善搜索的性能。语义搜索技术实现了信息的语义表示,知识推理,语义相关度计算,可以有效地解决当前检索技术所面临的困境。 本文首先介绍了搜索引擎的工作原理,分类和评价标准。接着详细研究了搜索引擎的现状,并分析了存在的问题。进而引出了语义搜索引擎,介绍了语义搜索引擎的相关术语,研究了其关键技术、工作原理及其发展和应用现状。 针对传统搜索引擎存在的不能理解语义的缺陷,本文提出了基于个性化本体的语义搜索引擎,并结合传统搜索引擎的技术和优势设计了一个可以增加语义理解功能的搜索引擎Sendu。Sendu 引擎采用Heritrix 作为爬虫在网络上抓取信息资源,以Lucene 框架构建传统的搜索引擎作为基础,为了增加语义理解能力,使用本体编辑工具protégé来创建领域本体。Sendu 引擎通过使用本体将用户查询关键词转换成可识别领域语义的术语。Sendu使用RDF API——jena 来进行推理,得到与用户搜索关键词有语义关系的词汇,比如同义词、上位词等。这些扩展的术语将会提高搜索引擎的查全率,比如当搜索“计算机”这个词的时候,jena 根据本体知识库,将会推导出它的同义词“电脑”,这样就将最终的查询扩展了查询“计算机”和“电脑”相关的网页。本体将以一种灵活的方式对术语进行组织。 Sendu 引擎还提出了增加三个语义搜索过滤器来过滤掉一些用户不想获得的网页,在原型系统实现时,可以让用户采取定制的方式来实现,比如,如果用户不考虑网上的一些PDF资源,那么语义搜索过滤器将会把这种格式的文档过滤,解决了当前搜索引擎忽略一些格式的文档资源。 最后,本文实现了Sendu 引擎原型系统,获得了较好的查全率和查准率。通过对这个系统性能的评估,对系统的改善提出了进一步意见,并对语义搜索引擎的应用前景进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号