首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于用户行为分析的网页目录自动构建

基于用户行为分析的网页目录自动构建

摘要

在过去的十多年里,互联网上的网站数量呈指数增长趋势,互联网上的网站数量已经突破1.5亿,而网页数量更是达到数百亿.用户往往需要借助搜索引擎和网页目录才能从这样海量的网页当中找到符合自己需求的高质量网页.传统的网页目录几乎都是采用人工构建的方法.这样的构建方法有着耗时多、不够客观、缺乏一致性以及无法及时反映新闻事件和热点事件等缺点.因此,开展网页目录自动构建方法的研究对提高网页目录的质量具有重要意义.本论文讨论和设计一种基于用户行为的网页目录自动构建方法.这种方法最大的特点是能够及时的发现最新的新闻时间和热点事件并在目录中以单独的类的形式表现出来.目录的构建核心步骤有高质量网页提取,网页关键访J提取以及网页聚类三步,每一步都是基于用户行为实现的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号