首页> 中文学位 >以博客内容为对象的个性化搜索研究
【6h】

以博客内容为对象的个性化搜索研究

代理获取

目录

文摘

英文文摘

声明

1 绪论

2 搜索引擎的理论基础

3 博客个性化搜索系统设计

4 博客个性化搜索系统实现

5 总结与展望

致 谢

参考文献

展开▼

摘要

一百个人,就有一百种搜索需求。而现有的搜索引擎基本上采用“一个搜索适用所有用户”的模型,把用户淹没在过量无效的信息中,无视用户的背景、兴趣爱好、行为、检索环境等。虽然现在第三代搜索引擎还没有问世,但是个性化无疑是解决上述问题的一个发展趋势。个性化搜索很简单,它的意思就是搜索引擎越了解你,那么它就越有能力为你剔除无关的搜索结果。这样的个性化搜索引擎就不再只是一个互联网上搜索有用信息的冷冰冰的工具,而是可以帮助我们理解自己,理解世界的朋友。
   为了实现个性化搜索,本文避开了传统的通过收集用户的点击流,用户的上网历史等伤害用户隐私的方式来建立用户兴趣模型,而是去深度挖掘用户愿意在网上公开发表的文章——博客,以此来识别用户的兴趣。在开源网络蜘蛛和开源检索库的帮助下,开发了一个以博客内容为对象的个性化搜索引擎,初步实现了个性化搜索和个性化推荐的功能。个性化搜索子系统,在分析了传统关键词排序技术的基础上,提出了加入用户兴趣因子的相似度定义,重写了搜索结果的排序算法。传统的搜索引擎只建立了关键词和信息之间的关系。这里隐式地从用户愿意公开发表的博客内容提取出用户兴趣,采用简洁明了的空间向量模型建立了人,关键词,信息之间的联系,改善了检索结果。个性化推荐子系统,通过计算用户之间的兴趣相似度,实现了给用户推荐博客文章以及推荐志趣相投的博友的功能,做到了人与人的交流互动。
   最后分析了系统可能面临的问题,提出了两个可能的发展方向和对未来完美搜索的憧憬。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号