文摘
英文文摘
授权书
第1章 绪 论
1.1 研究的背景及意义
1.2 国内外研究现状
1.3 研究重点和方法
1.4 本文的主要内容及结构
第2章 数据挖掘与聚类分析
2.1 数据挖掘综述
2.1.1 数据挖掘的概念
2.1.2 数据挖掘的流程
2.1.3 数据挖掘的分类
2.2 聚类分析综述
2.2.1 聚类分析的概念
2.2.2 数据类型和度量方法
2.2.3 主要聚类方法
2.3 小结
第3章 一种基于累积平均密度的聚类算法
3.1 DBSCAN算法
3.1.1 DBSCAN算法有关概念
3.1.2 DBSCAN算法的思想
3.1.3 DBSCAN算法的优缺点
3.2 基于累积平均密度的聚类算法
3.2.1 累积平均密度的相关定义
3.2.2 算法原理
3.2.3 算法描述
3.3 实验及性能分析
3.3.1 簇不相连的数据集聚类实验
3.3.2 簇相连的数据集聚类实验
3.3.3参数δ变化对聚类结果的影响
3.3.4 算法处理时间
3.4 小结
第4章 改进算法在网页正文提取中的应用
4.1 网页信息提取
4.2 基于密度聚类的网页正文提取方法
4.2.1 网页预处理
4.2.2 数据转换
4.2.3 聚类分析
4.3 实验
4.4 小结
结论
参考文献
附录A 攻读学位期间发表的论文情况
致 谢