声明
东华大学学位论文版权使用授权书
摘要
第1章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.3 本文主要工作
1.4 全文组织结构
第2章 Web数据挖掘及相关概念综述
2.1 数据挖掘概述
2.2 Web数据挖掘概述
2.2.1 Web数据挖掘的分类
2.2.2 Web日志挖掘的步骤
2.3 XML与Web日志挖掘
2.3.1 XML概述
2.3.2 XML在Web日志挖掘中的应用
2.4 本章小结
第3章 Web日志挖掘的数据预处理
3.1 Web日志文件格式介绍
3.2 Web日志挖掘预处理流程
3.2.1 数据清理
3.2.2 站点拓扑识别
3.2.3 页面过滤
3.2.4 用户识别
3.2.5 会话识别
3.2.6 路径补充
3.2.7 事务识别
3.3 实验结果
3.4 本章小结
第4章 用户频繁访问序列模式挖掘
4.1 频繁模式及关联规则概述
4.2 常用关联规则挖掘算法分析
4.2.1 Apriori算法
4.2.2 FP-growth算法
4.3 基于FP-growth改进算法的用户频繁访问序列挖掘
4.3.1 用户访问序列概述
4.3.2 FP-growth改进算法设计
4.3.3 FP-growth改进算法示例
4.4 同类算法比较及实验分析
4.4.1 同类算法比较
4.4.2 实验环境
4.4.3 实验对比分析
4.5 本章小结
第5章 基于多重评价因素的Web用户聚类
5.1 聚类分析概述
5.2 Web用户聚类
5.3 Web用户模糊聚类
5.3.1 传统用户相似度计算
5.3.2 基于多重评价因素的用户相似度计算
5.4 模糊聚类算法
5.5 聚类实验及结果分析
5.5.1 聚类有效性指标
5.5.2 调节参数确定
5.5.3 算法比较分析
5.6 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间发表的学术论文
致谢