声明
目 录
第一章绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 缺失值填补研究现状
1.2.2 聚类算法研究现状
1.2.3 数据质量检测规则研究现状
1.3 本文主要内容与创新点
(1)基于 APTANEKNN的缺失值填补方法
(2)基于 CCTANE的 CFDs自动发现方法
(3)基于 APTANEKNN-CCTANE的规则管理模块设计与实现
1.4 论文组织结构
第二章理论背景
2.1 缺失值填补理论
2.1.1 缺失值产生原因
2.1.2 填补方法分类
2.1.3 KNN 填补方法
2.2 聚类算法理论
2.2.1 聚类算法的分类
2.2.2 相似性度量方法
2.2.3 AP聚类算法
2.3 数据质量检测规则理论
2.3.1 FD 理论
2.3.2 FDs 自动发现常见算法
2.3.3 CFD理论
2.3.4 CFDs 自动发现常见算法
2.4 本章小结
第三章基于 APTANEKNN的缺失值填补方法
3.1APTANEKNN 算法概述
3.2 改进AP聚类算法
3.2.1 数据集相似性度量方法
3.2.2 算法描述
3.3 改进KNN填补算法
3.3.1 结合FDs 的KNN填补算法
3.3.2 算法描述
3.4APTANEKNN 算法流程
3.5 实验验证
3.5.1 实验环境
3.5.2 实验数据
3.5.3 实验设计
3.5.4 实验结果及分析
3.6 本章小结
第四章基于 CCTANE的 CFDs自动发现方法
4.1 CFDs自动发现概述
4.2.1 CTANE 算法
4.2.2 剪枝策略优化
4.3 CCTANE算法流程
4.4 实验验证
4.4.1 实验环境
4.4.2 实验数据
4.4.3 实验设计
4.4.4 实验结果及分析
4.5 本章小结
第五章基于 APTANEKNN-CCTANE的规则管理模块设计与实现
5.1 模块需求分析
5.2 模块设计
5.2.1 详细设计
5.2.2 数据库设计
5.2.3 接口设计
5.3.1 开发环境
5.3.2 功能界面展示
5.4 本章小结
第六章总结与展望
6.1 全文总结
6.2 后续工作展望
致 谢
参考文献
攻读硕士学位期间取得的成果
电子科技大学;