一种基于k-means算法和关联规则的缺失数据填补方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科学技术的发展，利用计算机来管理数据信息已经十分普遍地存在和应用于各行各业当中，并且在实际运行中积累了海量的数据。在对这些海量数据进行分析与提取的过程中会经常需要面对数据缺失的现象，甚至是不可避免的会遇到，缺失数据的存在会造成：系统丢失了大量的重要信息；系统中的不确定因素会表现的更加显著；使用正常的数据分析方法不适用或很难应用于这些数据集中；包含缺失数据的数据集会使数据分析过程陷人混乱，降低了对数据分析结果的准确性，导致了不可靠的输出，所以如何来处理这些缺失数据变得十分重要。
　　本文针对缺失数据这一问题，提出了一种基于K-means算法和关联规则的缺失数据填补方法，这一方法是将K-means聚类算法和关联规则挖掘算法这两种算法有效地融合在一起，利用K-means聚类算法提高了数据相似性，从而使关联规则挖掘算法的能挖掘出更多的强关联规则；利用关联规则挖掘算法弥补了K-means聚类算法填补缺失数据正确率低的问题。这一方法有效的解决缺失数据的填补问题，并且提高了对缺失数据的填补正确率。
　　在本文中还针对原始的K-means聚类算法中所存在的K值选取问题进行了改进，提出了基于计算数据聚类之间的间隙距离，来判断K-means聚类算法的K值选取是否合理，从而给出了合理的K值。在本文中也针对在使用关联规则挖掘算法时所存在的无规则可用和规则冲突等问题，提出了解决办法。

著录项

作者
王策;
展开▼
作者单位

哈尔滨工程大学;

展开▼
授予单位哈尔滨工程大学;
学科计算机技术
授予学位硕士
导师姓名张健沛;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
缺失数据; K-means聚类算法; 关联规则; 填补正确率; 间隙距离;

相似文献

中文文献
外文文献
专利

1. 一种基于双聚类的缺失数据填补方法 [J] . 郝胜轩 ,宋宏 ,周晓锋 . 计算机应用研究 . 2015,第003期
2. 一种基于近邻规则的缺失数据填补方法 [J] . 王凤梅 ,胡丽霞 . 计算机工程 . 2012,第021期
3. 一种基于K-means的关联规则聚类算法 [J] . 王琢 ,荀亚玲 ,张继福 . 太原科技大学学报 . 2016,第006期
4. 一种基于关联规则与K-means的领域本体构建方法 [J] . 李征 ,李斌 . 河南师范大学学报：自然科学版 . 2020,第1期
5. 一种食品安全信息系统缺失数据填补方法 [J] . 鄂旭 ,李建革 ,杨健 . 计算机技术与发展 . 2014,第004期
6. 基于结构方程模型的缺失数据填补方法比较 [C] . . 2016年中国生物统计学术年会 . -1
7. 基于Savitzky-Golay去噪算法与主成分分析的缺失数据填补算法研究 [A] . 王祥玉 . 2017

一种基于k-means算法和关联规则的缺失数据填补方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅