声明
致谢
变量注释表
1 绪论
1.1研究动机
1.2研究目标
1.3研究内容
(2)考虑ENN降噪、代理模型预测的实例选择策略
1.4研究方法
(1) 基于可移除性和边界特征的动态重要数据查找实例选择
(2)基于代理模型预测数据重要性的实例选择
1.5成果意义
(1)充分考虑了可移除性和边界特征对于实例数据重要性更新的影响,设计了基于可移除性和边界特征的动态重要数据查找实例选择
(2)针对在大数据集上时间复杂度大等问题,提出了基于代理模型预测数据重要性的实例选择
1.6本文结构
1.7 本章小结
2 相关工作
2.1.1 实例选择概念
2.1.2 实例选择评价准则
2.2实例选择方法
2.2.1过滤型实例选择
2.2.2 封装型实例选择
2.3代理模型
2.3.1多项式函数
2.3.2 高斯过程
2.4 本章小结
3基于可移除性和边界特征的动态重要数据查找实例选择
3.1 引言
3.2可移除性定义
3.3实例重要性的更新
3.4基于动态约简率的实例选择
3.5仿真实验结果与分析
3.5.1 背景
3.5.2 数据可视化
3.5.3在中小数据集实例选择的有效性
3.5.4在大数据集上实例选择的有效性
3.6 本章小结
4 基于代理模型预测数据重要性的实例选择
4.1 引言
4.2 高斯预测模型构建及模型输入波动性和相关性分析
4.2.1 高斯过程预测模型及模型评价
4.2.2高斯过程预测系统框架
4.2.3待删减数据特征与类中心距离相关特性分析
4.3 融合降噪和代理模型预测数据重要性的实例选择策略
4.3.1降噪
4.3.2 基于代理模型预测数据重要性实例选择策略
4.4仿真实验结果与分析
4.4.1 ENN降噪的有效性分析
4.4.2 高斯过程代理模型的预测效果
4.4.3 标准数据集可视化
4.4.4 中小数据集实例选择的有效性
4.4.5在大数据集上实例选择的有效性
4.5本章小结
5 总结与展望
5.1本文工作
(1) 针对当前实例选择算法无法平衡准确率与运行时间的问题实例,提出了基于可移除性和边界特征的动态重要数据查找实例选择
(2) 针对大数据环境下计算复杂度高、运行时间长的问题,提出了基于代理模型预测数据重要性的实例选择
5.2本文创新之处
5.3进一步研究工作
参考文献
作者简历
学位论文原创性声明
学位论文数据集