首页> 中文学位 >基于点击日志分析的数字图书多侧面搜索系统研究
【6h】

基于点击日志分析的数字图书多侧面搜索系统研究

代理获取

摘要

伴随着互联网的蓬勃发展,数字图书馆的优势得到越来越充分的体现,并且得到了各国政府的高度关注。在过去的十多年里,数字图书馆发展迅速,业已成为公众获取知识的重要途径,其中的数字图书搜索则是数字图书馆必须提供的支撑性服务。本文针对数字图书馆中如何利用用户的查询日志来改进数字图书的检索结果进行了深入的研究与开发,以帮助用户有效地使用CADAL数字资源。
   传统的数字图书检索系统是一种数据单向流动的请求应答模式,需要匹配用户确定的需求。然而现实中用户的需求往往是开放的、变化的、模糊的,在这种场景下,传统的检索只能返回大量的匹配结果,失去了检索行为的意义,因此有必要加以研究改进以提高数字资源的利用率。
   本文围绕基于多重查询意图的CADAL图书搜索系统的研发,主要工作如下:
   第一,实现了一种点击流上的基于奇异值分解的隐含查询意图挖掘方法。利用CADAL平台丰富的用户使用口志数据,挖掘用户对检索结果的隐式反馈信息。然后根据挖掘到的用户隐含查询意图实现基于查询词和图书的多重分类,并对不同规模数据集的结果进行了分析比对,最终将其应用到检索过程中以改善检索质量。
   第二,通过分析CADAL服务平台的实际情况,给出了基于多重查询意图的CADAL图书搜索系统的总体设计、模块划分以及每个模块的功能和流程,并按系统的整体架构给出了系统的技术支撑框架和各部分的技术实现解决方案。基于上述工作,开发了基于多重查询意图的CADAL图书搜索系统,通过多维度的方式向用户提供数字图书多重分类的检索结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号