声明
1 引 言
1.1研究背景与意义
1.1.1研究背景
1.1.2研究意义
1.2 国内外研究现状
1.2.1聚类算法的研究现状
1.2.2聚类有效性研究现状
1.2.3 混合数据的聚类有效性问题研究现状
1.3 论文组织结构
1.4本文主要工作
2 聚类有效性相关理论基础
2.1聚类分析一般原理
2.1.1聚类分析的相似性度量
2.1.2聚类分析的基本步骤
2.1.3常用的聚类算法概述
2.2聚类结果的评价
2.2.1聚类有效性评价标准
2.2.2聚类有效性评价指标
2.2.3常见的有效性指标
2.2.4最佳聚类数目的确定方法
3 混合数据最佳聚类数确定方法
3.1混合数据的预处理
3.2基本算法及其改进
3.2.1 k-prototypes 算法及其特点
3.2.2基于简单抽样和分类型数据属性确定初始聚类中心
3.2.3 基于Gower 距离改进分类型数据距离的测算
3.2.4基于混合数据主成分分析法计算分类型数据权重
3.3基于D-S证据理论确定最佳聚类数的方法
3.3.1 D-S 证据理论的基本概念
3.3.2 D-S 证据理论的应用优势
3.3.3 最佳聚类数确定算法DSKP
4 改进的 DSKP 算法的实证分析
4.1数据解读
4.2改进的DSKP算法应用过程及结果
5 几点结论
5.1改进的DSKP算法总结
5.1.1 避免D-S 证据理论的原有缺陷
5.1.2优化混合数据的聚类有效性问题
5.2聚类有效性未来可能的发展方向
5.2.1探索聚类算法对聚类有效性的影响
5.2.2研究算法参数对聚类有效性的影响
5.2.3探究复杂数据下的聚类有效性
5.2.4加强指标构建的理论研究
5.2.5平衡指标性能和效率
参考文献
后 记
兰州财经大学;