基于超链接的WEB结构挖掘算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着Internet/Web技术的快速普及和迅猛发展，其为人们提供了丰富的信息资源的同时，它所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web资源的发掘造成了相当的难度。因此，将数据挖掘技术和Web结合起来，进行Web数据挖掘也就随之成为了解决Web挖掘问题的重要途径。本文通过对经典的Web结构挖掘算法HITS和PageRank的研究学习，针对HITS算法中完全只考虑web页面之间的超链接分析而忽略的web页面的内容，从而导致分析结果出现主题偏移和种种的不足，提出了一种结合超链接分析和内容相关性分析的关于HITS的改进算法，该算法通过对不同web页面进行内容分析并赋予链接之间不同的权重来实现对HITS的改进，并最终通过实验证明该新算法的有效性。最后我们还针对HITS算法和PageRank算法中在对页面节点进行排序时存在将页面权威性与枢纽性完全分开或忽视了页面的枢纽性，造成信息的丢失等问题，通过重新设定PageRank算法中的个性化矢量因子E，探讨建立在此基础上的HubRank算法，并通过实验验证了该算法对该问题的有效性。

著录项

作者
江裕民;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名霍红卫;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;国际互联网;
关键词
互联网结构挖掘; 超链接; 挖掘算法; 数据挖掘; 页面超链接; 互联网;

相似文献

中文文献
外文文献
专利

1. Web结构挖掘与其基于超链接结构的算法 [J] . 张佳 ,梁少华 . 科技信息 . 2007,第002期
2. 基于Web结构挖掘中HITS算法的研究 [J] . 王月琦 . 中学教学参考 . 2018,第015期
3. 基于PageRank和HITS的Web结构挖掘算法研究 [J] . 刘栋 ,刘希玉 ,郝婷婷 . 山东科学 . 2006,第004期
4. 基于超链接分析技术的排序算法的研究 [J] . 高国顺 ,许翠云 . 中国校外教育（美术） . 2012,第012期
5. 基于超链接分析技术的排序算法的研究 [J] . 高国顺 ,许翠云 . 中国校外教育：上旬 . 2012,第012期
6. 改进Web结构挖掘算法 [C] . 霍红卫 ,江裕民 . 2006年全国理论计算机科学学术年会 . 2006
7. Web信息检索中基于超链接的网页评估算法的研究 [A] . 董志勇 . 2004

基于超链接的WEB结构挖掘算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅