首页> 中文学位 >基于改进VSM的个性化搜索引擎的研究与设计
【6h】

基于改进VSM的个性化搜索引擎的研究与设计

代理获取

目录

文摘

英文文摘

南开大学学位论文版权使用授权书及原创性声明

第一章绪论

第二章搜索引擎技术介绍

第三章个性化搜索引擎系统(PSE)的设计

第四章基于改进VSM的个性化模块设计

第五章相关算法的分析

第六章结论及进一步的工作

致谢

参考文献

个人简历

展开▼

摘要

上世纪90年代至今,随着互联网的飞速发展,Web上的各种资源正在以爆炸式的速度膨胀。面对汪洋的Web信息资源,如何从中高效的精确的检索信息,也成了当前迫切需要解决的课题。 以检索Web信息为主要功能的搜索引擎系统应运而生,用户可以通过搜索引擎系统来查找Web上自己所需的资源。搜索引擎已成为互联网上仅次于电子邮件的第二大网络应用。 但是,Web规模的迅速发展,使得利用搜索引擎来检索信息也越来越困难,究其主要原因,其一是因为搜索引擎对用户检索的意图理解不够,现在的搜索引擎大多需要用户以严格的关键词来检索,由于用户往往无法贴切的表达自己的意图,造成用户的“信息迷向”;二是因为面对如此规模的互联网信息库,即使用户能够贴切表达意图,也可能会淹没在庞大的结果集中,从而造成用户的“信息过载”。 个性化是这一问题的有效解决途径,个性化的实质是因人施制,根据不同用户的兴趣有针对性的进行检索。 本文在研究了搜索引擎技术以及传统个性化技术的基础上,分析了基于VSM(VectorSpaceModel)的用户模型以及基于Ontology的用户模型的优点以及不足:VSM模型是基于严格关键词的查询,无法考虑用户兴趣词条之间关系,并且无法克服一词多义对结果的影响;而基于Ontology的用户模型,只解决了根据语义理解对用户查询进行优化,而没有考虑对检索结果的过滤。本文根据以上的情况,设计了一个基于改进VSM的个性化搜索引擎系统(PSE,PersonalizedSearchEngine),改进之后的用户模型,通过对兴趣词条进行分类来优化用户查询,并克服了一词多义的问题,而且根据用户的兴趣对检索结果进行了过滤,减小了不同的检索模块对检索结果的影响。本文介绍了改进VSM模型的表示,建立和更新方法,以及改进模型对查询的优化检索结果的过滤,并给出了相关算法,对算法的复杂度进行了分析。最后对系统作出了总结,并指出了进一步的工作。

著录项

  • 作者

    刘超;

  • 作者单位

    南开大学;

  • 授予单位 南开大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 袁晓洁;
  • 年度 2006
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.52;
  • 关键词

    搜索引擎; 用户模型; 向量空间模型; 兴趣模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号