声明
致谢
摘要
1.1 论文背景及意义
1.2 国内外研究现状
1.3 论文主要内容
1.4 论文组织结构
2 相关理论
2.1 基于密度的聚类算法DBSCAN
2.1.1 概念
2.1.2 算法实现
2.2 图的存储及连通性
2.2.1 有向图的存储
2.2.2 有向图的连通性
2.3 强连通分量搜索算法Tarjan
2.4 文本数据预处理
2.4.1 中文分词
2.4.2 文本表示
2.4.2 相似度计算
2.5 本章小结
3 非均匀密度数据集下的聚类算法AV-DBSCAN
3.1 问题描述
3.2 算法概念
3.3 算法准备工作
3.3.1 M-近邻有向图
3.3.2 参数选择
3.3.3 MinPts-邻域有向图
3.4 算法实现
3.4.1 算法原理及流程
3.4.2 算法实现伪代码
3.4.3 算法分析
3.5 本章小结
4 大规模非均匀密度数据下的聚类算法BIRAV-DBSCAN
4.1 问题描述
4.2 利用层次结构的平衡迭代归约聚类算法BIRCH
4.2.1 概念
4.2.2 聚类流程
4.3 BIRAV-DBSCAN算法实现
4.3.1 第一阶段BIRCH聚类
4.3.2 第二阶段AV-DBSCAN聚类
4.3.3 算法分析
4.4 本章小结
5 实验结果与分析
5.1 性能评价指标
5.2 仿真数据集实验
5.2.1 聚类实现
5.2.2 结果分析
5.3 真实数据集实验
5.3.1 数据采集
5.3.2 数据预处理
5.3.3 聚类实现
5.3.4 结果分析
5.4 本章小结
6.1 总结
6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集