首页> 中文学位 >Web使用挖掘与网页个性化服务推荐研究
【6h】

Web使用挖掘与网页个性化服务推荐研究

代理获取

摘要

数据挖掘是计算机科学、人工智能和数据库研究方向的一项重要课题,它是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web页面包含复杂的、无结构的、动态的数据信息,如何对Web上的海量信息进行分析,针对用户的需求,提供个性化推荐服务,是当今数据挖掘技术一项重要的应用。本文在总结前人研究成果的基础上,针对Web使用挖掘进行了研究,主要内容归纳如下:
   (1)对数据挖掘的基本理论知识和分类进行了总体研究,详细分析了Web使用挖掘的数据源,数据预处理的基本流程。
   (2)对关联规则相关理论进行了详细的介绍,分析了经典Apriori算法的性能,对其进行了改进。在自然连接产生候选集以前先进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数。
   (3)详细的介绍了K-means聚类算法的基本思想以及流程,分析了它的优缺点,提出了一种改进的K-means算法,即MFA算法。针对K-means算法中每次调整簇中心后确定新的簇中心需要大量的距离计算,提出一种利用簇中心的变化信息来确定新簇中心的方法,通过从动态簇中心集中选取候选集的方法减少了过滤算法的计算复杂度。
   (4)对校园网网站的日志数据进行分析处理,利用改进的挖掘算法进行数据挖掘,发现用户的访问模式,最后利用挖掘结果,给网站添加个性化推荐功能,主动为用户推荐其可能感兴趣的信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号