首页> 中文学位 >基于模糊聚类的Web访问模式挖掘
【6h】

基于模糊聚类的Web访问模式挖掘

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 选题研究的来源

1.2 选题的研究意义和价值

1.3 国内外研究现状

1.4论文的研究思想和内容安排

2 Web数据挖掘

2.1数据挖掘概述

2.2 Web数据挖掘

2.3 Web使用挖掘

3 基于模糊粗糙K-Means的用户访问模式聚类

3.1模糊数学

3.2粗糙集

3.3 聚类算法

3.4基于模糊的web会话预处理

3.5粗糙K-Means聚类

3.6 实例分析

4 模式挖掘算法

4.1 Web访问模式挖掘算法

4.2拓展的Web访问模式挖掘算法

4.3评估函数

4.4实例分析

4.5小结

5 实验评估

5.1数据集

5.2评估方法

5.3评价标准:点击率、覆盖率和精确率

5.4 结果评估

6 结论

致谢

参考文献

攻读学位期间参与项目和发表的学术论文

展开▼

摘要

通过发现web日志数据中有用的访问模式可以帮助我们更好的实现web个性化和web结构再调整。目前,对web日志挖掘还处于深入探索阶段,成熟的理论和方法还没有完全形成,有待进一步的研究。传统的关联规则算法已不能处理日益庞大的数据量和多样的数据类型,而基于频率的web日志挖掘技术提取出的信息也往往对于最终用户来说并没有太大的效用。
  本文研究了基于模糊聚类的web访问模式挖掘算法。
  首先,为了度量不同用户访问模式之间的相似度与相异度,等长的模糊向量被用来刻画用户浏览网页的时间,其中的每个要素要么为0,要么为模糊语言所表示的模糊变量,该向量不仅能够体现用户是否访问过该网页,而且还可以刻画用户在网页上的浏览时间。数据的浏览时间用模糊语言变量来表示,这符合人们的正常思维方式,并且可以忽略访问时间与访问时间之间的微小差异。由于类与类之间不存在清晰的边界,因此使用模糊粗糙K-Means算法对这些表征用户浏览特征的用户模式进行聚类。实验表明,该方法能够有效降低时间复杂度和提高系统准确性。
  其次,考虑到网页访问频率、访问时间都可以反映用户兴趣,提出了一个新的方法用来解决网页访问模式的提取问题,这个方法在聚类的基础上可高效提取web访问模式,模式值运用了一个用户自定义的评估函数来计算。基于不同数据集的实验表明,上述解决方案可以从大规模数据集中高效发现web访问模式。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号