首页> 中文学位 >基于用户行为与本体的查询词扩展研究
【6h】

基于用户行为与本体的查询词扩展研究

代理获取

摘要

在信息检索技术中,查询词扩展是一种能够有效提高查询效率的技术。因此,通过充分发挥查询词扩展技术的优越性可以大大提高搜索引擎在搜索精确度方面的效率。查询词扩展技术通过将与用户查询词相近、相关的词扩展到用户查询词中的方法,更准确地描述用户的信息需求,去除用户查询词的多义性,从而更精确地查询用户所需信息。
   为了更好地实现查询词扩展,解决传统查询词扩展技术缺少智能性以及主题性差的问题,结合形式概念分析与用户行为(搜索日志)、本体(Ontology)进行查询词扩展,可以综合三者的优点,形成一套基于形式概念分析、用户行为、本体的查询词扩展方法,从而提高搜索引擎的查询准确率。
   本文的主要研究内容归纳如下:
   1.提出了一种基于用户搜索行为的查询词扩展源的抽取方法。分析用户的搜索历史和点击网页历史以及他们之间的潜在相关性,同时考虑搜索返回网页顺序和用户点击网页顺序,从网页中抽取出能表达用户搜索意图、用户兴趣的相关词作为查询扩展词,将网页和抽取出的查询扩展词分别作为概念的对象和属性并构造概念格,将其作为查询词扩展源。实验表明使用本文方法抽取的查询词扩展源优于使用传统方法抽取的扩展源。
   2.提出一种构建用户本体的方法。从WordNet中抽取出查询词与查询扩展源的相等、相似、ISA、partof等语义关系,利用本体的构建方法,把查询词、查询词扩展源以及它们之间的语义构建成用户本体。
   3.提出了一种基于本体的查询词扩展方法。利用本体的相似、相等、上义、下义和PartOf语义关系,提出一个基于本体的查询词与概念相似度计算的新方法。通过这种查询词与概念相似度的量化,可以很好的找到与查询词最相关概念进行查询词扩展,从而提高用户搜索准确率。实验通过把本文方法的查询词扩展结果与目前其它方法的查询词扩展结果对比,表明了本文提出的方法是具有可行性的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号