声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文工作及结构
第2章 大数据挖掘技术概述与分析
2.1 大数据挖掘概述
2.1.1 大数据概念与特点
2.1.2 数据挖掘的介绍
2.2 聚类技术
2.2.1 划分聚类
2.2.2 层次聚类
2.2.3 基于密度的聚类
2.3 海量数据处理技术
2.3.1 抽样技术
2.3.2 增量式技术
2.3.3 分布式技术
2.3.4 云计算
2.4 本章小结
第3章 基于增量式的核模糊聚类算法研究
3.1 增量式聚类模型
3.2 增量式核模糊聚类算法
3.3 改进的基于增量式的核模糊聚类算法
3.3.1 单个数据块初始聚类中心的优化
3.3.2 多个传递点的选取
3.3.3 改进算法的流程
3.4 实验结果与分析
3.4.1 数据集
3.4.2 数据划分方法
3.4.3 性能指标
3.4.4 结果与分析
3.5 本章小结
第4章 分布式k-means算法研究
4.1 分布式聚类模型
4.2 分布式k-means算法分析
4.3 改进的分布式k-means算法
4.3.1 局部聚类结果的改进
4.3.2 基于距离和分布的局部聚类结果合并的方法
4.3.3 改进的分布式k-means算法描述
4.4 实验结果与分析
4.4.1 与集中式k-means算法的比较
4.4.2 与K-Dmezns算法的比较
4.5 本章小结
第5章 结论与展望
5.1 本文工作总结
5.2 不足与展望
参考文献
攻读硕士期间学位期间发表的论文及其它成果
致谢