文摘
英文文摘
第一章 绪论
1.1 课题背景与研究意义
1.2 国内外研究发展现状
1.2.1 国外研究发展现状
1.2.2 国内研究发展现状
1.3 本文的主要内容和结构安排
第二章 数据挖掘与Web日志挖掘基本理论
2.1 数据挖掘
2.1.1 数据挖掘的含义
2.1.2 数据挖掘的主要过程
2.1.3 数据挖掘的主要方法
2.2 Web挖掘基本理论
2.2.1 Web挖掘的定义
2.2.2 Web挖掘的一般过程
2.2.3 Web挖掘的分类
2.3 Web日志挖掘基本理论
2.3.1 Web日志挖掘的过程
2.3.2 Web日志挖掘的主要分析方法
2.3.3 Web日志挖掘的应用
2.4 本章小结
第三章 Web日志挖掘的数据预处理研究
3.1 Web日志挖掘的数据来源
3.2 数据预处理的意义
3.3 Web服务器日志文件
3.4 数据清洗
3.4.1 数据清洗的原则
3.4.2 数据清洗的算法研究
3.5 用户识别
3.5.1 用户识别的难点
3.5.2 用户识别的方法研究
3.6 用户会话识别与路径补充
3.7 本章小结
第四章 基于个性化时间阈值的用户会话识别方法
4.1 会话识别的基本概念
4.2 基于时间戳的会话识别方法
4.3 基于时间戳的用户会话识别算法的不足
4.4 基于个性化时间阈值的用户会话识别算法
4.5 实验结果及分析
4.6 路径补充
4.7 本章小结
第五章 用户行为模式发现
5.1 序列模式挖掘的基本概念
5.2 事务识别与MFR算法
5.3 基于关联规则的用户频繁序列模式发现
5.3.1 关联规则与Apriori算法
5.3.2 基于类Apriori算法的用户频繁序列模式发现
5.4 本章小结
第六章 基于多重因子约束的序列模式发现算法
6.1 传统类Apriori算法的不足
6.2 基于多重因子约束的算法改进
6.2.1 页面兴趣度因子
6.2.2 页面重要性因子
6.2.3 基于多重因子约束的算法改进
6.3 实验结果及分析
6.4 本章小结
第七章 总结
7.1 论文工作总结
7.2 存在问题和对未来的展望
致谢
参考文献
修改提纲