首页> 中国专利> 一种基于KPCA和ELM的时空分离分布参数系统建模方法

一种基于KPCA和ELM的时空分离分布参数系统建模方法

摘要

本发明公开了一种基于KPCA和ELM的时空分离分布参数系统建模方法,基于KPCA和ELM的时空模型来逼近非线性系统,该模型通过时空分离的思想,将时空耦合的分布参数系统模型表示为关于空间的基函数和关于时间的低阶时序模型;通过对低阶时序模型的学习得到分布参数系统的动态特性后,再进行时空重构得到时空模型;本发明建立的模型能在线预测,具有计算效率高、计算精度高等优点。

著录项

  • 公开/公告号CN112800675A

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 广东工业大学;

    申请/专利号CN202110113864.4

  • 申请日2021-01-27

  • 分类号G06F30/27(20200101);G06N3/08(20060101);G06K9/62(20060101);

  • 代理机构44329 广东广信君达律师事务所;

  • 代理人孔祥健

  • 地址 510062 广东省广州市越秀区东风东路729号

  • 入库时间 2023-06-19 10:58:46

说明书

技术领域

本发明涉及建模及数据预测的技术领域,尤其涉及到一种基于KPCA和ELM的时空分离分布参数系统建模方法。

背景技术

随着科学技术的不断发展,很多系统变得越来越复杂,要求得控制效果也越来越精确,由经典控制理论来描述的集中参数系统已经无法完全满足工业需求。近些年,随着传感器技术、控制器技术和计算技术的进步,越来越多的学者们开始研究被控对象同时存在时间和空间分布的系统,即分布参数系统。由于其自身的无穷维特性以及时空分布特性,在使用传统方法对其进行控制时面临一系列的困难。与此同时,在实际的工业过程中,每个工业对象在本质上或多或少都具有非线性特征。所以为了方便控制器的设计和被控对象的实时监控,针对非线性分布参数系统建立有效的模型是非常有必要的。

针对于分布参数系统的时空耦合特性,基于时空分离的建模思想被广泛应用,使得模型能够被降低到足够低的阶次,满足于工业控制的需要。传统的模型递减的方法是残差权重法,其学习的主要思想是表示的残差往权重函数的投影最小,其主要缺点是需要DPS模型为已知的。而使用较为广泛的是Karhunen-Loève(KL)方法,其又叫做主成分分析法(PCA)或者奇异值分解法(SVD)。他的建模思想主要是先对实验采集到的时空数据进行降维处理,通过求特征值特征向量问题来得到有限个数的空间基函数。然后使用传统的集中建模方法,比如神经网络(NN),支持向量机(SVM),模糊模型等方法来确定低阶时序模型。最后通过时空重构,便可以获得原系统的基于数据的DPS模型。这种方法的缺点是,因为K-L法属于线性的方法,对于非线性较强的系统往往无法取得理想的效果。

在机器学习与模式识别领域,有很多非线性维数递减方法被广泛研究,其中一些被用于非线性分布参数系统建模,并且取得了不错的效果。局部线性嵌入和拉普拉斯特征映射,可以在降维过程中保留高维数据的非线性流形结构,因此对于存在强非线性特征的高维数据,使用这类方法将会更加有效。其缺点是很依赖于K邻近数和距离计算方式的选取,且要求数据样本集是均匀稠密的。中南大学的陆新江教授针对分布参数系统的建模问题,提出了一种全新的时空LS-SVM建模方法。这种LS-SVM使用核函数作为空间基函数,因此它可以处理空间信息。该技术的缺点是:基于LS-SVM的识别算法由于其实现简单,被广泛应用于面向块模型的识别。然而,冗余参数的特点往往导致学习速度慢,计算可扩展性差。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于KPCA和ELM的时空分离分布参数系统建模方法,建立的模型能在线预测,具有计算效率高、计算精度高等优点。

为实现上述目的,本发明所提供的技术方案为:

一种基于KPCA和ELM的时空分离分布参数系统建模方法,基于KPCA和ELM的时空模型来逼近非线性系统,该模型通过时空分离的思想,将时空耦合的分布参数系统模型表示为关于空间的基函数和关于时间的低阶时序模型;通过对低阶时序模型的学习得到分布参数系统的动态特性后,再进行时空重构得到时空模型;

具体包括以下步骤:

S1、通过KPCA对时空数据进行降维处理,分离得到满足要求个数的空间基函数,并得到相应的低阶时间系数;

S2、利用ELM对低阶时间系数进行学习,得到可表示出系统时间动态特性的低阶时序模型,同时利用得到的模型对后续的时间系数进行预测,然后与空间基函数进行时空重构,得到时空预测数据;

S3、对模型预测效果进行验证,利用另一个独立ELM对其预测的误差进行学习,得到残差预测模型,然后将预测的残差数据与原来预测数据进行补偿,得到最终的精确度更高的时空预测数据。

进一步地,所述步骤S1中,通过KPCA对时空数据进行降维处理,分离得到满足要求个数的空间基函数的具体过程如下:

分布参数系统使用偏微分方程PDE来描述;由于这类系统具有空间分布的特性,所以本质上它们属于无限维的系统;为了方便理解,假设DPS模型的PDE描述可表达为下式:

(1)式中,α,β,ω为未知的参数,u(t)表示系统的输入信号,b(x)为关于坐标x的一个光滑函数,代表输入信号u(t)如何分布在坐标[x

边界条件为:

y(0,t)=0,y(π,t)=0,

初始条件为:

y(x,0)=y

根据傅里叶变换,任意的非线性连续函数均可使用傅里叶级数来展开;因此,时空变量y(x,t)沿一组空间基函数

(2)式中,

其中选择的n组空间基函数能反应系统绝大部分的能量;

为得到主导空间基函数

上式中:

针对该优化问题,存在一个极值必要条件:

(6)式中,R(x,ζ)=为相关函数;

由上式可得,求解上述积分方程的解即可得到前面所提到的优化问题;

根据快照法可知,空间基函数

将(7)式代入到(6)式中可得下面特征值问题:

定义两点间的时间相关函数为:

因此,式(6)中的特征值问题由n×n维的转化为下列n

(10)式中,λ

KPCA学习空间基函数;

KPCA通过非线性映射φ实现输入空间到特征空间的转换,然后对映射后的数据进行线性PCA,因而具有很强的线性处理能力;

对于输入空间的M个样本x

对于PCA方法,即通过求解特征方程

Cν=λν (12)

获得贡献率最大的特征值及与之对应的特征向量;现引入非线性特征映射函数φ,使输入空间中的样本点x

则在特征空间F中的自相关矩阵为:

现求

(15)式中,λ为

可得到式(15)的等价方程:

存在一组相应的系数

将式(14)和式(17)代入式(16)可得:

其中,k=1,...,M;

通过特征向量,定义一个N×N的矩阵K:

定义两个矩阵:

①N×N的K矩阵为引入的核矩阵,通过原始空间中的数据代入核函数中可计算;

②N×1的向量α,其中第j个元素是参数α

因此式(18)可写成如下形式:

式(20)中,K

令λ

式(22)中,

Kα=λα (23)

特征向量γ要归一化为单位长度,根据(17)和(23)即需要对α作以下处理:

式(24)中,p为核矩阵中非零特征值的个数;

由式(13)可知,假设特征空间中的数据为中心化的,但实际中并非如此,要想得到归一化的数据的核矩阵

其中,

定义累积贡献率:

式(26)中,λ

进一步地,所述步骤S2中,对称布线具体为:

所述步骤S2中,利用ELM对低阶时间系数进行学习,得到可表示出系统时间动态特性的低阶时序模型的具体过程如下:

极限学习机本质为单隐层前馈神经网络SLFNs;

给定输入输出样本集

任何非线性连续函数f(x)均采用误差为零的SLFNs逼近,即

其中,

上式中,H为SLFNs的隐层输出矩阵,H的第i列为输入数据u

式中,

ELM学习低阶时序模型;

在经过计算得到合适的空间基函数

(31)式中,<>代表内积;当低阶数据获得后,下一步为低阶动态建模;一边情况下,非线性时序动态通过下式来表达:

a

式中,d

利用ELM可逼近任意非线性系统,在选择好合适的输入信号后,结合之前的低阶时序输出即可得到当前时刻的输出信号。

进一步地,所述步骤S3的具体过程如下:

通过下式得到全局时空数据的预测输出:

由于即使累积贡献率E

引入一个残差:

其表示时空数据的真实值和预测值之间的误差;希望学习残差的动态模型,来对预测结果进行补偿修正;与低阶时序模型的类似,用ELM来得到残差的模型;

残差的时序动态由下式表示:

e(x,t)=f(a(t-1),...,a(t-d

(35)式中,d

与现有技术相比,本方案原理及优点如下:

1.本方案为一种纯基于数据的建模方法,不需要知道系统的具体动态特性和机理,通过可采集的相关时序数据即可预测系统动态特性。

2.采用KPCA算法对于非线性较强的分布参数系统有更好的效果,能取得更少的空间基函数个数。

3.采用ELM算法,因此具有较快的学习速度和较小的计算复杂度;该模型计算效率高,适用于在线估计和控制。

4.加入补偿模型,能够解决选取基函数个数能量趋近于1而误差较大的问题,比一般的时空模型精度更高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种基于KPCA和ELM的时空分离分布参数系统建模方法的总体技术路线图;

图2为SLFNs的结构示意图;

图3为分布参数系统的时空模型建模流程图;

图4为磷酸铁锂电池单体示意图;

图5为传感器位置布置示意图;

图6为使用KPCA获得的空间基函数的示意图(i=1,2,3);

图7为s3、s10、s20传感器处温度预测值与真实值对比图;

图8为模型的TNAE(a)和SNAE(b)图;

图9为残差修正后s3、s10、s20传感器处温度预测值与真实值对比图。

具体实施方式

下面结合具体实施例对本发明作进一步说明:

本发明实施例所述的一种基于KPCA和ELM的时空分离分布参数系统建模方法,基于KPCA和ELM的时空模型来逼近非线性系统,该模型通过时空分离的思想,将时空耦合的分布参数系统模型表示为关于空间的基函数和关于时间的低阶时序模型;通过对低阶时序模型的学习得到分布参数系统的动态特性后,再进行时空重构得到时空模型;

如图1所示,包括以下步骤:

S1、通过KPCA对时空数据进行降维处理,分离得到满足要求个数的空间基函数,并得到相应的低阶时间系数;

在数学上,分布参数系统使用偏微分方程PDE来描述;由于这类系统具有空间分布的特性,所以本质上它们属于无限维的系统;假设DPS模型的PDE描述可表达为下式:

(1)式中,α,β,ω为未知的参数,u(t)表示系统的输入信号,b(x)为关于坐标x的一个光滑函数,代表输入信号u(t)如何分布在坐标[x

边界条件为:

y(0,t)=0,y(π,t)=0,

初始条件为:

y(x,0)=y

根据傅里叶变换,任意的非线性连续函数均可使用傅里叶级数来展开;因此,时空变量y(x,t)沿一组空间基函数

(2)式中,

其中选择的n组空间基函数能反应系统绝大部分的能量;

为得到主导空间基函数

上式中:

其中λ

针对该优化问题,存在一个极值必要条件:

(6)式中,R(x,ζ)=为相关函数;

由上式可得,求解上述积分方程的解即可得到前面所提到的优化问题;

根据快照法可知,空间基函数

其中γ

将(7)式代入到(6)式中可得下面特征值问题:

定义两点间的时间相关函数为:

因此,式(6)中的特征值问题由n×n维的转化为下列n

式中,λ

KPCA学习空间基函数;

KPCA通过非线性映射φ实现输入空间到特征空间的转换,然后对映射后的数据进行线性PCA,因而具有很强的线性处理能力;

对于输入空间的M个样本x

对于PCA方法,即通过求解特征方程

Cv=λv (12)

获得贡献率最大的特征值及与之对应的特征向量;现引入非线性特征映射函数φ,使输入空间中的样本点x

则在特征空间F中的自相关矩阵为:

现求

(15)式中,λ为

可得到式(15)的等价方程:

存在一组相应的系数

将式(14)和式(17)代入式(16)可得:

其中,k=1,...,M;

通过特征向量,定义一个N×N的矩阵K:

定义两个矩阵:

①N×N的K矩阵为引入的核矩阵,通过原始空间中的数据代入核函数中可计算;

②N×1的向量α,其中第j个元素是参数α

因此式(18)可写成如下形式:

式(20)中,K

令λ

式(22)中,

Kα×λα (23)

特征向量γ要归一化为单位长度,根据(17)和(23)即需要对α作以下处理:

式(24)中,p为核矩阵中非零特征值的个数;

由式(13)可知,假设特征空间中的数据为中心化的,但实际中并非如此,要想得到归一化的数据的核矩阵

其中,

定义累积贡献率:

式(26)中,λ

S2、利用ELM对低阶时间系数进行学习,得到可表示出系统时间动态特性的低阶时序模型,同时利用得到的模型对后续的时间系数进行预测,然后与空间基函数进行时空重构,得到时空预测数据;

极限学习机本质为单隐层前馈神经网络SLFNs,如图2所示;

给定输入输出样本集

任何非线性连续函数f(x)均采用误差为零的SLFNs逼近,即

其中,

上式中,H为SLFNs的隐层输出矩阵,H的第i列为输入数据u

式中,

ELM学习低阶时序模型;

在经过计算得到合适的空间基函数

(31)式中,<>代表内积;当低阶数据获得后,下一步为低阶动态建模;一边情况下,非线性时序动态通过下式来表达:

a

式中,d

利用ELM可逼近任意非线性系统,在选择好合适的输入信号后,结合之前的低阶时序输出即可得到当前时刻的输出信号。

ELM因其无需更新输入层和隐含层的权值和偏置,在计算速度上有明显优势。

S3、对模型预测效果进行验证,利用另一个独立ELM对其预测的误差进行学习,得到残差预测模型,然后将预测的残差数据与原来预测数据进行补偿,得到最终的精确度更高的时空预测数据。

在得到合适的空间基函数和低阶时序模型后,通过时空合成来进行数据重构,得到需要的时空数据。在不改变外界条件的基础上,将空间基函数看成是不变的。结合低阶时序模型的输出,通过下式得到全局时空数据的预测输出:

由于即使累积贡献率E

引入一个残差:

其表示时空数据的真实值和预测值之间的误差;希望学习残差的动态模型,来对预测结果进行补偿修正;与低阶时序模型的类似,用ELM来得到残差的模型;

残差的时序动态由下式表示:

e(x,t)=f(a(t-1),...,a(t-d

(35)式中,d

最终分布参数系统的时空模型建模流程如图3所示。

下面以单片锂离子电池放电时温度场建模为例,进行具体实施:

随着国家对新能源汽车的推行,锂离子电池凭借其工作电压高、能量密度高、循环寿命长、无记忆效应等优点,成为汽车动力电池的首选。如图4所示,在电池单体表面放置20枚热电偶温度传感器,检测在随机输入信号的激励下,电池以1C的放电倍率进行放电。设置负极接地,放电截止电压设置为2.3V,输出温度间隔为1s。总共获得1370个数据,前1100个数据被选择用于模型估计,后270个数据被选择用于模型验证。图5为传感器的分布情况,横向间隔为2.5cm,纵向间隔为6cm;

第一步,使用KPCA的方法对采集到的温度数据进行降维处理,得到空间基函数,同时求出相应的低阶时间系数。得到的空间基函数利用三次样条插值法可以得到其基于空间的分布。基函数的选取与累积贡献率的选取有关,这里选取当选取的基函数的阶数为3时,空间基函数的分布情况如图6所示;

第二步,根据所得到的低阶时间系数,将前1100组数据的低阶时间系数作为训练数据,建立ELM低阶时序模型,然后用后270组数据作为测试集数据,对模型的的预测效果进行检测。选取其中传感器s3、s10、s20的温度来检验模型效果,如图7所示。

同时引入RMSE、TNSE、RNSE三个指标来作为模型误差衡量标准。其表示方法如下:

(1)均方根误差(RMSE)

(2)时间标准绝对误差(TNAE)

(3)空间标准绝对误差(SNAE)

当隐层节点数为55时,其最大误差为0.078℃,RMSE为0.0436。TNAE和SNAE如图8所示。

可以看出最高的TNAE不超过0.1℃,最高的SNAE不超过0.05℃,表示模型训练取得了较好的效果。

第三步,作为对模型的优化改进,采用另一个独立的ELM,采取与预测低阶时间系数相同的模型输入,来预测模型预测值与真实值的误差,对模型的预测结果进行残差补偿。在1100组训练数据集中,选取后164组(1100的15%)作为验证集,可得到训练集训练模型的预测与真实的误差,并用此来训练误差模型。最后同时在测试集中进行预测输出,最终的预测结果为温度预测输出与预测误差之和。当温度预测模型中隐层节点数为58,误差预测模型中隐层节点数为7时,选取与上一步相同的3个点的位置的输出值与预测值对比如图9所示。

可以很明显的看出,经过残差修正的模型预测结果比之前的效果要好。进一步比较两个模型的相关性能,如表1所示:

表1两种方法模型性能比较

已知空间基函数个数的选取与模型要求的累计贡献度有关。累积贡献度越高,空间基函数包含的信息越多,则拟合效果会更好。由上表可以看出原模型(KPCA-ELM)取4个空间基函数时RMSE都不如增加了残差修正的模型。同时从TNAE和SNAE来看,增加了修正的模型也具有更好的效果。而从仿真时间的角度来看,可能由于数据样本不够多,且ELM的运算速度极快,二者并没有明显差距。此外,利用ELM算法的机制,该方法具有较快的学习速度,适用于在线相关应用。

以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号