首页> 中文学位 >基于路径相似度的Web用户模糊聚类算法研究
【6h】

基于路径相似度的Web用户模糊聚类算法研究

代理获取

目录

封面

声明

摘要

Abstract

目录

第一章 绪论

1.1 论文的选题背景及研究意义

1.2 Web 挖掘的国内外研究现状

1.3 本文研究目的

1.4 本文工作

1.5 论文组织结构

第二章 Web 使用挖掘

2.1 Web 使用挖掘过程

2.2 确定数据源

2.2.1 数据准备

2.2.2 本文数据源选择

2.3 Web 日志数据预处理过程

2.3.1 数据清洗

2.3.2 用户标识

2.3.3 会话标识

2.3.4 路径补全

2.4 本章小结

第三章 Web 用户模糊聚类

3.1 聚类

3.1.1 聚类分析中的数据类型

3.1.2 聚类的基本流程

3.1.3 聚类的分类

3.2 模糊聚类

3.2.1 模糊集相关概念

3.2.2 模糊聚类的基本过程

3.2.3 数据标准化

3.2.4 建立模糊相似矩阵

3.3 Web 用户模糊聚类

3.3.1 传递闭包法

3.3.2 最大树法

3.3.3 动态直接聚类

3.4 本章小结

第四章 基于路径相似度的Web 用户模糊聚类

4.1 本文算法的提出

4.2 Web 用户特征表示

4.2.1 现有的Web 用户特征表示方法

4.2.2 现有方法的不足

4.2.3 用户兴趣度表示用户特征

4.3 用户兴趣度

4.3.1 用户兴趣度一

4.3.2 用户兴趣度二

4.3.3 数据说明

4.4 相似度的计算

4.4.1 现有算法的相似度选取及不足

4.4.2 本文算法的相似度选取

4.5 算法流程

4.5.1 相关概念

4.5.2 算法思想

4.6 实验及结论

4.6.1 实验一

4.6.2 实验二

4.7 小结

第五章 总结与展望

5.1 论文工作总结

5.2 进一步工作

参考文献

致谢

攻读硕士期间发表论文

攻读硕士期间参与科研项目

展开▼

摘要

Web使用挖掘是应用数据挖掘技术从Web日志数据中发现使用模式的过程,是当前数据挖掘领域中的一个热点。
  本文提出了基于路径相似度的Web用户模糊聚类算法。算法中给出了两种用户兴趣度计算方法,通过该兴趣度抽取了用户最感兴趣的页面访问路径,然后根据页面访问路径相似度来聚类用户。实验证明,本文算法能够减小计算量,提高聚类的运行效率,并得到满意的用户聚类集合。

著录项

  • 作者

    王华;

  • 作者单位

    西北师范大学;

  • 授予单位 西北师范大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 王治和;
  • 年度 2010
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    Web用户; 路径相似度; 模糊聚类算法; 数据挖掘;

  • 入库时间 2022-08-17 10:25:17

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号