文摘
英文文摘
声明
第1章绪论
1.1课题背景
1.2论文的研究内容及组织
1.2.1论文的主要研究内容
1.2.2论文的组织
第2章数据挖掘及Web挖掘概述
2.1数据挖掘
2.1.1数据挖掘定义
2.1.2数据挖掘的过程
2.1.3数据挖掘的技术
2.2 Web挖掘
2.2.1 Web挖掘概述
2.2.2 Web日志挖掘及相关概念
第3章 Web站点日志数据预处理
3.1 Web日志数据预处理的必要性
3.1.1 Web访问日志格式
3.1.2访问日志预处理的必要性
3.2 Web日志数据预处理过程
3.2.1数据净化
3.2.2用户识别
3.2.3会话识别
3.2.4路径补充
3.2.5事务识别
第4章聚类分析
4.1聚类分析的定义
4.2聚类算法的要求
4.3主要聚类算法的分类
4.3.1划分方法(partitioning method)
4.3.2层次方法(hierarchical method)
4.3.3基于密度的方法(density-based method)
4.3.4基于网格的方法(grid-based method)
4.3.5基于模型的方法(model-based method)
4.3.6模糊聚类方法(Fuzzy Clustering)
第5章模糊聚类算法
5.1模糊数学的研究现状及发展
5.2模糊集相关理论
5.2.1模糊集合的概念
5.2.2模糊集合的表示法
5.2.3模糊集的运算及其性质
5.3模糊等价关系
5.3.1自反性、对称性与传递性
5.3.2模糊等价关系与聚类图
5.4模糊相似关系与传递闭包
5.5模糊聚类分析
5.5.1数据预处理
5.5.2基于模糊等价关系的聚类方法
第6章 Web事务模糊聚类算法
6.1算法模型
6.2算法描述
6.2.1从Web日志生成Web事务集合
6.2.2用户浏览时间的离散化表示方法
6.2.3 Web站点用户访问矩阵表示及数据标准化
6.2.4构建模糊相似矩阵
6.2.5模糊相似矩阵的t-bridge等价闭包求法
6.2.6采用λ截矩阵法进行模糊聚类分析
6.3算法举例及试验分析
6.3.1算法举例
6.3.2算法试验分析
第7章结论
7.1总结
7.2进一步的工作
参考文献
攻读学位期间公开发表论文
致谢
研究生履历