Web链接结构挖掘中HITS算支的分析与改进

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来,随着Internet/Web 技术的快速普及和迅猛发展,它为人们提供了丰富的信息资源的同时,其所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web 资源的发掘造成了相当的难度。因此,将数据挖掘技术和Web 结合起来,进行Web 数据挖掘也就随之成为解决Web 挖掘问题的重要途径。
　　在传统的信息检索技术己经成熟的现状下,从Web 数据本身的特点出发,充分地挖掘Web 上庞大的超链接资源,通过超链接进行搜索,建立有效的Web 信息检索模型,从而找到需要的信息。但传统的基于超链接的网页搜索排序算法是纯粹地基于链接分析(即Web 结构挖掘)来发现权威网页,没有考虑网页的具体内容,存在所谓的“主题漂移”问题,即算法的结果往往包含这样一些网页,它们相互链接密度较高,但在内容上却偏离了查询主题。
　　本文通过对经典的Web 结构挖掘算法HITS算法的研究学习,针对HITS算法中只考虑Web 页面之间的超链接分析而忽略了Web 页面的内容,从而导致分析结果出现“主题偏移”和主题之间的多重加强关系等不足,提出了一种结合超链接分析和内容相关性分析的关于HITS算法的改进算法——G-HITS算法,该算法通过对不同Web 页面进行内容分析并赋予链接之间不同的权重来实现对HITS算法的改进,一定程度上改善了HITS算法的不足,更好的实现了权威网页的查找。最后通过实验证明G-HITS算法的有效性。

著录项

作者
张阿红;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科计算机应用技术
授予学位硕士
导师姓名王治和;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
Web链接; 信息检索; 数据挖掘; 主题偏移;

相似文献

中文文献
外文文献
专利

1. 基于Web结构挖掘的HITS算法分析与改进 [J] . 王舜燕 ,甘泉 . 软件导刊 . 2007,第002期
2. 基于Web结构挖掘中HITS算法的研究 [J] . 王月琦 . 中学教学参考 . 2018,第015期
3. 基于Web结构的数据挖掘中HITS算法的研究 [J] . 赵炎 . 黑龙江教育（理论与实践） . 2018,第005期
4. Web结构挖掘中HITS算法改进的研究 [J] . 范聪贤 ,徐汀荣 ,范强贤 . 微计算机信息 . 2010,第003期
5. Web结构挖掘中HITS算法的改进 [J] . 郭鸿 ,周娅 . 微型机与应用 . 2009,第016期
6. 基于链接分析的WEB社区挖掘探讨 [C] . YAO Aiguo ,姚爱国 ,DENG Zhen . 第18届全国计算机新科技与计算机教育学术大会 . 2007
7. Web结构挖掘中HITS算法的研究 [A] . 卢虹宇 . 2008

Web链接结构挖掘中HITS算支的分析与改进

目录

摘要

著录项

相似文献

相关主题

期刊订阅