首页> 中文学位 >一种基于k-means算法和关联规则的缺失数据填补方法
【6h】

一种基于k-means算法和关联规则的缺失数据填补方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究的背景和意义

1.2国内外研究概况

1.3本文的思路和结构安排

第2章 相关理论与技术

2.1缺失数据

2.2当前的缺失数据填补方法

2.3 本章小结

第3章 基于K-means和关联规则的缺失数据填补算法

3.1算法思想

3.2 K-means聚类算法中如何选取K值的问题

3.3关联规则冲突问题

3.4算法总体步骤

3.5算法分析

3.6本章小结

第4章 实验对比及结果分析

4.1实验方案

4.2离散型数据集

4.3连续型数据集

4.4实验结论

4.5本章小结

结论

参考文献

致谢

展开▼

摘要

随着科学技术的发展,利用计算机来管理数据信息已经十分普遍地存在和应用于各行各业当中,并且在实际运行中积累了海量的数据。在对这些海量数据进行分析与提取的过程中会经常需要面对数据缺失的现象,甚至是不可避免的会遇到,缺失数据的存在会造成:系统丢失了大量的重要信息;系统中的不确定因素会表现的更加显著;使用正常的数据分析方法不适用或很难应用于这些数据集中;包含缺失数据的数据集会使数据分析过程陷人混乱,降低了对数据分析结果的准确性,导致了不可靠的输出,所以如何来处理这些缺失数据变得十分重要。
  本文针对缺失数据这一问题,提出了一种基于K-means算法和关联规则的缺失数据填补方法,这一方法是将K-means聚类算法和关联规则挖掘算法这两种算法有效地融合在一起,利用K-means聚类算法提高了数据相似性,从而使关联规则挖掘算法的能挖掘出更多的强关联规则;利用关联规则挖掘算法弥补了K-means聚类算法填补缺失数据正确率低的问题。这一方法有效的解决缺失数据的填补问题,并且提高了对缺失数据的填补正确率。
  在本文中还针对原始的K-means聚类算法中所存在的K值选取问题进行了改进,提出了基于计算数据聚类之间的间隙距离,来判断K-means聚类算法的K值选取是否合理,从而给出了合理的K值。在本文中也针对在使用关联规则挖掘算法时所存在的无规则可用和规则冲突等问题,提出了解决办法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号