首页> 中文会议>第27届中国数据库学术会议 >基于伪反馈的XML查询扩展

基于伪反馈的XML查询扩展

摘要

伪反馈一直以来都被认为是一种有效的查询扩展技术。但是近来的研究表明传统的伪反馈容易带来主题漂移并因此而影响检索性能。如何确定相关文档以及如何从相关文档中挑选有用的扩展词项是伪反馈中两个重要的方面。与传统查询扩展不同,XML查询扩展不仅需要内容扩展还需要考虑结构扩展。提出了一个解决框架,利用聚类和词组抽取技术来查找相关文档和选择有用的扩展信息。结合XML的语义特征,提出了一种全新的基于层次信息的文档相似性度量方案。基于此,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式。IEEE CS实验数据上的实验结果表明,结合了聚类和抽取技术的XML伪反馈查询扩展方法能有效地降低主题漂移现象,获得更好的检索质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号