首页> 中文学位 >基于超链接的WEB结构挖掘算法的研究
【6h】

基于超链接的WEB结构挖掘算法的研究

代理获取

目录

文摘

英文文摘

创新性声明和关于论文使用授权的说明

第一章绪论

第二章Web数据挖掘概述

第三章Web结构挖掘算法

第四章Web结构挖掘算法的改进

4.1 Weighted-HITS算法

4.2 HubRank算法

第五章总结

致谢

参考文献

在校期间科研成果

展开▼

摘要

近年来,随着Internet/Web技术的快速普及和迅猛发展,其为人们提供了丰富的信息资源的同时,它所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web资源的发掘造成了相当的难度。因此,将数据挖掘技术和Web结合起来,进行Web数据挖掘也就随之成为了解决Web挖掘问题的重要途径。 本文通过对经典的Web结构挖掘算法HITS和PageRank的研究学习,针对HITS算法中完全只考虑web页面之间的超链接分析而忽略的web页面的内容,从而导致分析结果出现主题偏移和种种的不足,提出了一种结合超链接分析和内容相关性分析的关于HITS的改进算法,该算法通过对不同web页面进行内容分析并赋予链接之间不同的权重来实现对HITS的改进,并最终通过实验证明该新算法的有效性。最后我们还针对HITS算法和PageRank算法中在对页面节点进行排序时存在将页面权威性与枢纽性完全分开或忽视了页面的枢纽性,造成信息的丢失等问题,通过重新设定PageRank算法中的个性化矢量因子E,探讨建立在此基础上的HubRank算法,并通过实验验证了该算法对该问题的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号