PLS回归算法的改进及其应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

现代仪器科学的快速发展提供了大量高维或者高阶的分析数据，但是依据传统的化学、物理或者生物的分析手段难以从这些现代仪器采集的高阶或者高维数据中提取有用的化学信息。为更好地对先进分析仪器获得的校正样本的高维或高阶数据进行分析建模，并用来指导对未知样本进行的预测，化学计量学应运而生。化学计量学包含了分析量测的全过程，包括采样理论与方法、实验设计与优化、数据信号处理、多元校正与分辨、化学定量构效关系和智能专家系统等。它是一门计算机、化学等综合的交叉学科，利用了最优化方法、统计学、机器学习或数据挖掘以及其他相关学科的知识，选择出最优试验设计和测量方法，并从实验数据中最大限度地挖掘与研究被分析物的的性质、结构形态等方面的信息。因此，化学计量学已成为数据挖掘的一个重要的应用研究领域。目前，偏最小二乘（PLS）算法已经在化学计量学、生物信息学以及图像处理等很多领域中得到了广泛的应用。PLS是一类基于隐变量的学习方法，能有效地将多元线性回归、主成分回归以及典型相关分析等方法进行结合，能够进行多响应变量的输出。基于传统的PLS算法已经发展了稳健偏最小二乘、核偏小二乘和二阶偏最小二乘等改进算法。本论文主要研究了几个PLS回归算法的改进算法，并将这些改进算法应用在多组分分析和小分子与生物大分子的相互作用中，对未来的相关应用研究有着很好的指导意义。本文的主要创新点如下：（1）针对PLS性能容易受到共线性和奇异点干扰进而造成模型过拟合的问题，提出将基于稀疏矩阵变化的稳健协方差估计方法应用到PLS中。该方法能够消除自变量之间的共线性关系；同时还提出基于主成分空间奇异点检测的PLS方法，该方法能够有效发现高维空间中的奇异点。两种方法均从数据预处理的角度实现了样本协方差矩阵的稳健估计，都能使得最终模型更加稳健。将所提出的算法用在荧光光谱对苯基丙氨酸、色氨酸和酪氨酸的同时测定实验中，实验结果验证了所提出的算法的有效性。（2）针对核PLS中存在的过拟合问题，提出将净分析物预处理的方法进行核化，得到基于核的净分析物预处理的特征选择方法，再将该方法应用于核PLS，去除了高维特征空间中与因变量无关的特征，该方法能有效去除自变量中的无关特征，达到了降维的效果，提升了模型的准确度。将改进得到的算法用于样本中多种金属离子浓度同时测定的实验中，实验结果表明该算法能够取得比较理想的计算结果。（3）针对二阶PLS中存在的过拟合问题，提出加入了L1范数正则化约束的稀疏NPLS，使得NPLS在各个阶方向上出现在最终模型的特征个数减少，从而避免了过拟合问题，提高了模型的泛化能力，同时也增强了模型的可解释性。算法被应用在吲哚乙酸与过氧化氢酶的相互作用机理研究的实验中，得到了与化学实验相吻合的结果。（4）将随机梯度提升学习方法应用在前面的各个改进算法，进一步避免了模型的过拟合问题，进一步增强了模型的泛化能力。同时随机梯度提升学习还可以解决NPLS中高阶数据存储量过大不可计算的问题。相关的改进算法被用于溶液中多组分浓度的同时测定实验中。

著录项

作者
朱新峰;
展开▼
作者单位

南京航空航天大学;

展开▼
授予单位南京航空航天大学;
学科计算机应用技术
授予学位博士
导师姓名王建东;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类汽车工程;土力学、地基基础工程;
关键词
PLS; 回归算法; 改进;

相似文献

中文文献
外文文献
专利

1. 基于改进的(加权)支持向量机回归算法在水处理中的应用研究 [J] . 王启超 ,梁礼明 . 科技与生活 . 2011,第008期
2. PLS回归方法在汽车滑行试验中的应用研究 [J] . 姚博炜 ,彭磊 ,乔维高 . 汽车工程学报 . 2012,第002期
3. 基于改进PLS和PLS_ZP算法的卫星移动通信信道估计 [J] . 仲伟志 ,王红娟 . 四川大学学报（工程科学版） . 2015,第001期
4. PLS回归在国际机场服务改进中的应用 [J] . 祁明亮 ,张勇 ,姚杰 . 数理统计与管理 . 2006,第1期
5. 人民币实际汇率影响因素的实证分析——基于偏最小二乘回归算法(PLSR) [J] . 胡文涛 ,张理 ,汪季雪 . 金融与经济 . 2018,第002期
6. 基于改进型混合蛙跳算法的支持回归机大坝变形预测模型 [C] . 卢远富 ,包腾飞 ,李涧鸣 . 全国大坝安全监测技术信息网第八届全网大会暨2015年全国大坝安全监测技术与应用学术交流会 . 2015
7. 改进高斯过程回归算法及其应用研究 [A] . 赵梦恩 . 2018

PLS回归算法的改进及其应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅