首页> 中文学位 >面向数据驱动建模的数据预处理方法研究
【6h】

面向数据驱动建模的数据预处理方法研究

代理获取

目录

第1章 绪论

1.1研究背景和意义

1.2数据预处理的国内外研究现状

1.3本文主要研究内容及章节安排

第2章 数据驱动建模相关理论研究

2.1数据驱动的原理与发展

2.2数据驱动建模的主要方法

2.3数据驱动建模的一般流程

2.4数据驱动建模的影响因素

2.5本章小结

第3章 基于遗传优化的缺失值自适应填补算法研究

3.1缺失值问题分析

3.2缺失值处理策略

3.3缺失值的遗传自适应填补方法研究

3.4本章小结

第4章 基于全局距离和的异常值检测算法研究

4.1异常值问题分析

4.2经典的异常值检测方法

4.3一种基于全局距离和的异常值检测算法

4.4本章小结

第5章 数据预处理在电站锅炉建模中的应用研究

5.1建模方法介绍

5.2基于LSSVM的烟气含氧量软测量仿真实验

5.3本章小结

第6章 结论

6.1全文总结

6.2研究展望

参考文献

致谢

攻读硕士学位期间的研究成果

展开▼

摘要

由于生产工艺、技术及设备的日趋复杂化,经典控制理论中依据物理化学机理建立精确数学模型对生产过程进行控制的传统方法已变得越来越困难。在此背景下,数据驱动思想得到快速发展,然而采集于生产过程中的监测数据往往存在含有缺失值、异常值等数据质量问题,如果直接利用这些未经处理的数据进行数据驱动作预测或决策,所建模型的准确性会受到极大影响,甚至产生错误的分析结果。因此,在数据驱动建模前必须对数据进行预处理。  本文首先对数据驱动以及数据预处理的发展进行了回顾和总结,介绍了数据驱动建模的相关理论知识,对数据预处理的基本任务和相应的主要方法作了详细阐述。  然后,本文对缺失值填补问题进行了重点研究。在总结分析现有主要填补方法的基础上,针对工业过程监测数据的实际特点,提出了一种基于遗传优化的自适应填补算法,并成功运用于电站锅炉监测数据的缺失值填补,对于不同工况下产生的缺失值以及在缺失率较高的情况下,该算法都具有较为理想的准确率与稳定性。  之后,着重研究了异常值检测问题。在比较学习异常值检测主要算法优缺点的基础上,给出一种基于全局距离和的异常值检测算法,不仅消除了经典的基于距离的异常值检测算法对参数设置的敏感性,而且降低了数据分布不均对检测算法的影响,同时量化了异常值的异常程度。在电站锅炉监测数据上仿真分析,结果表明该算法具有较高查全率和较低误报率。  最后,分别利用未经预处理和经本文所提算法预处理的数据建立基于最小二乘支持向量机的电站锅炉烟气含氧量软测量模型,通过对比所建模型的准确度,表明本文所提的基于遗传优化的自适应缺失值填补算法和基于全局距离和的异常值检测算法等数据预处理算法有效改善了数据质量,为监控电站锅炉的运行、提高其燃烧效率及降低污染排放奠定了坚实的数据基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号