首页> 中国专利> 一种带时延估计的加权高斯模型软测量建模方法

一种带时延估计的加权高斯模型软测量建模方法

摘要

本发明公开了一种带时延估计的加权高斯模型软测量建模方法,属于复杂工业过程建模和软测量领域。所述方法包括采用滑动灰关联度算法估计过程时延参数,提取过程时延信息;当新样本到来时,基于离线阶段估计的时延参数对建模样本进行重构;并通过相对于训练样本的权重,建立加权高斯模型,构建输入和输出变量的联合概率密度函数;最后,通过条件分布函数实时估计输出变量值对关键变量进行精确预测,通过一种直观有效的方式,同时计算复杂低,从过程历史数据库中提取变量的时滞信息用于软测量建模数据重构,校正了输入输出间实际的因果对应关系,有效的解决了过程随机噪声的干扰,得到更加精确的预测结果,从而提高产品质量,降低生产成本。

著录项

  • 公开/公告号CN108984851A

    专利类型发明专利

  • 公开/公告日2018-12-11

    原文格式PDF

  • 申请/专利权人 江南大学;

    申请/专利号CN201810652184.8

  • 发明设计人 熊伟丽;车笑卿;马君霞;

    申请日2018-06-22

  • 分类号

  • 代理机构哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人张勇

  • 地址 214000 江苏省无锡市蠡湖大道1800号

  • 入库时间 2023-06-19 07:35:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-04

    授权

    授权

  • 2019-01-04

    实质审查的生效 IPC(主分类):G06F17/50 申请日:20180622

    实质审查的生效

  • 2018-12-11

    公开

    公开

说明书

技术领域

本发明涉及一种带时延估计的加权高斯模型软测量建模方法,属于复杂工业过程建模和软测量领域。

背景技术

在实际工业过程中,一些关键变量的测量对于生产高质量的产品至关重要,但是在现有技术条件和经济代价等问题的约束下,使得直接获取关键变量变得十分困难;基于这样的背景下,软测量技术应运而生;它通过构建过程易测变量和关键变量的函数关系,来推断和估计难测的关键变量,因此得到了广泛应用。

然而实际工业过程数据通常会因为测量变化和传输干扰等因素被随机噪声污染,从而表现出一定的不确定性。传统的建模方法如主成分回归((principle componentregression,PCR)、偏最小二乘回归(Partial Least Squares Regression,PLSR)、人工神经网络(Artificial Neural Network,ANN)和支持向量机(Support Vector Machine,SVM)等都是确定性建模方法,往往会受到数据的随机噪声影响导致模型精度下降。为了更准确地对过程数据进行建模,基于数据密度分布的概率方法,如概率主成分回归(probabilistic principal component analysis,PPCR)和因子分析((Factor analysis,FA)表现出一定的优势。考虑到大多数过程数据近似服从高斯分布,而简单的高斯模型不足以准确地捕捉数据结构。为了解决这一问题,基于高斯混合模型(Gaussian Mixed Model,GMM)的非线性建模方法得到应用。然而,在应用中仍然受到局限。比如,高斯成分个数不易确定,计算负荷和模型复杂性会随高斯成分个数成倍增加等。

一些实际工业过程中存在着时延特性,如系统储蓄单元引起的容积时延,信号传输途中出现的纯时延,物料运输带来的滞后等。这些情况下,若采用不考虑时延特性的软测量建模方法,可能导致辅助变量与主导变量的因果关系发生改变,从而建立的模型精度较差。因此,为了更好地解释过程的因果性,建立精确的软测量模型,建模过程中考虑时延显得尤为重要。

针对时延问题,已有许多学者展开了研究。Fortuna L等利用过程装置工艺设计参数估计时延的大概范围,由于只是粗略地估计时延,因此模型预测精度较差;Komulainen T和Zhang J通过计算输入输出变量间的相关系数来估计时延,只考虑了变量间线性关系,对于非线性过程可能得不到理想的效果;李妍君等采用模糊曲线分析估计时延参数,但是对样本个数却有一定的要求;阮宏镁等运用DE算法优化脱丁烷塔过程变量间的联合互信息来确定过程时延参数,但是智能优化算法容易陷入局部最优,计算复杂度较高。

发明内容

为了解决目前存在的问题,本发明提供了一种带时延估计的加权高斯模型软测量建模方法。

滑动灰关联度分析作为一种异步比较变量间相关程度的方法,对样本的大小没有过高的要求,不需要满足典型的分布规律,而且可以对系统发展态势提供量化的度量,非常适合对工业过程进行时延估计。因此本发明采用该方法确定最优时延。通过引入不同的时延信息扩展输入变量,构造输入变量和输出变量之间的模糊逻辑,从而确定对输出变量最重要的输入变量所对应的时滞值,此时的时延参数则为该输入变量的最优时延。

一种基于滑动灰关联分析(MGRA)的加权高斯模型回归在线软测量方法能够很好的处理时延和非线性,提高软测量模型的性能。离线阶段采用滑动灰关联度分析方法估计过程时延参数,以提高模型对过程状态的解释和逼近能力;当查询样本到来时,首先对建模样本进行重构;然后,计算历史样本和查询样本之间的距离,基于该距离来设置历史样本的权重,建立加权的高斯模型。最后,通过输入输出的条件密度函数,估计查询样本的预测输出值。

针对实际化工过程存在的时延特性,同时考虑到过程数据中随机噪声的干扰,提出了一种基于滑动灰关联度分析的在线加权高斯模型软测量建模方法。

首先采用滑动灰关联度算法估计过程时延参数,提取过程时延信息;当新样本到来时,基于离线阶段估计的时延参数对建模样本进行重构;并通过相对于训练样本的权重,建立加权高斯模型,构建输入和输出变量的联合概率密度函数;最后,通过条件分布函数实时估计输出变量值,实现对化工过程产品质量的在线估计,从而提高产量,降低生产成本。

其中,基于局部加权学习的高斯模型(Weighted Gaussian model,WGM),可以逼近复杂的非线性曲线,能够很好地捕获样本周围的局部数据结构。

本发明的目的是通过以下技术方案实现的:

基于滑动灰关联度分析的在线加权高斯模型软测量建模方法,所述方法包括以下过程:针对实际化工过程存在的时延特性,同时考虑到过程数据中随机噪声的干扰,用滑动灰关联度分析算法对过程数据进行分析,确定出各输入变量的最优时延参数,并进行数据的重构。

当新样本到来时,基于离线阶段估计的时延参数对建模样本进行重构;并通过相对于训练样本的权重,建立加权高斯模型,构建输入和输出变量的联合概率密度函数;最后,通过条件分布函数即可实现对关键变量的精确预测,从而提高产品质量,降低生产成本。

所述一种带时延估计的加权高斯模型软测量建模方法,包括:

步骤1:获取历史采样输入和输出数据,组成历史训练样本数据库;根据过程机理和经验确定最大时延参数Tmax

步骤2:将历史训练样本数据库中的训练样本数据进行归一化处理,通过滑动灰关联度分析算法确定各输入变量的最优时延参数,所述最优时延参数定义为λ12,,,λm;其中m为训练样本的维度;

步骤3:对训练样本数据按照滑动灰关联度分析算法确定的最优时延参数进行数据重构;

步骤4:当查询样本xq到来时,在线对查询样本xq建立加权高斯模型。

可选的,所述通过滑动灰关联度分析确定各输入变量的最优时延参数,包括:

通过滑动灰关联度分析算法选择重要的输入变量:构建输入和输出变量之间的函数关系,从而确定对输出变量重要的输入变量;假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xi(t)为第t时刻样本的第i个变量,y(t)为对应的输出变量;

引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t-1),…,xi(t-λ),…,xi(t-Tmax)},其中,t为输出变量的采样时刻,λ为待确定的时延变量;对于每个输入变量xi(t-λ),i=1,2,...,m在t时刻与其输出变量y(t)的关联系数定义为:

式(1)中,r(xi(t-λ),y(t))表示t时刻第i个变量时延值为λ的滑动灰关联度大小;ρ∈[0,1],为分辨系数;

通过式(1)得到n个样本的关联系数,对于一个整体的待比较数列而言,定义其灰关联度为:

对r(xi,λ,y)按大小进行排序,得到各个时延参数下辅助变量对主导变量的重要程度;

根据各个时延参数下辅助变量对主导变量的重要程度确定各输入变量的最优时延参数。

可选的,所述根据各个时延参数下辅助变量对主导变量的重要程度确定各输入变量的最优时延参数,包括:

若式(2)得到的灰关联度r(xi,λ,y)越接近1,相对应的辅助变量xi(t-λ)对主导变量的贡献率越大;由此确定各输入变量的最优的时延参数。

可选的,所述当查询样本xq到来时,在线对查询样本xq建立加权高斯模型,包括:

历史训练样本数据库中的输入样本xi与查询样本xq相应的欧氏距离定义为:

其中,di是查询样本与第i个历史样本之间的距离;距离越大,表示历史样本与查询样本的相关性越小,对应的权重越小;权重定义如下:

式中,δ为调整参数;

在查询样本xq周围构建加权高斯模型。

可选的,所述在查询样本xq周围构建加权高斯模型,包括:

假设历史输入和输出联合向量为Z=[xT,yT]T,查询样本xq周围的输入和输出变量的联合密度分布服从高斯分布:

其中,θw={μw,Cw},μw、Cw分别表示权重为w下的均值和方差;

采用加权对数似然函数对参数μw进行估计,确定最优参数;

对所述加权对数似然函数进行极大似然估计,得到加权高斯模型的最优参数为:

在使用历史训练样本数据库中的训练样本数据对得到的加权高斯模型进行训练后,在查询样本周围得到一个加权高斯模型来描述输入和输出变量的联合密度分布;

对于多变量高斯分布,根据联合向量Z将均值向量μw和协方差Cw分割成与其相对应的输入和输出部分;

其中,uw,x表示权重为w的历史输入样本的均值,uw,y表示权重为w的历史输出样本的均值,Cw,xx表示权重为w的历史输入样本的自协方差,Cw,yy权重为w的历史输出样本的自协方差;Cw,xy表示权重为w的历史输入输出样本的协方差;

对于特定的查询样本xq,输出变量的分布服从高斯分布;因此,查询样本xq的预测输出值和预测方差分别为:

可选的,所述方法为应用于复杂工业过程中对无法直接测量的变量的预测方法。

可选的,所述复杂工业过程包括化工、冶金、发酵和污水处理过程。

可选的,所述方法为应用于脱丁烷塔过程中对于丁烷浓度的预测方法。

可选的,所述方法为应用于发酵过程中的青霉素过程中的方法。

本发明有益效果是:

通过以一种直观有效的方式,同时在计算复杂低的情况下,从过程历史数据库中提取变量的时滞信息用于软测量建模数据重构,校正了输入输出间实际的因果对应关系,同时有效的解决了过程随机噪声的干扰,能够很好地提取过程时滞信息,相对于传统的不考虑时滞的在线模型,能够得到更加精确的预测结果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为建模数据集重构过程;

图2为MGRA-OWGR建模方法流程图;

图3为不同δ下的WGR模型的RMSE;

图4为BIC值与高斯成分个数之间的关系;

图5为三种模型的预测误差曲线;

图6为脱丁烷塔过程简要示意图;

图7为不同δ下WGR的RMSE值;

图8为BIC值与高斯成分个数之间的关系;

图9为WGR模型下的丁烷浓度预测结果。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

实施例一:

本实施例提供一种带时延估计的加权高斯模型软测量建模方法,所述方法包括:

步骤1:获取历史采样输入和输出数据,组成历史训练样本数据库;根据过程机理和经验确定最大时延参数Tmax

步骤2:将历史训练样本数据库中的训练样本数据进行归一化处理,通过滑动灰关联度分析算法确定各输入变量的最优时延参数,所述最优时延参数定义为λ12,,,λm;其中m为训练样本的维度;

步骤3:对训练样本数据按照滑动灰关联度分析算法确定的最优时延参数进行数据重构;

步骤4:当查询样本xq到来时,在线对查询样本xq建立加权高斯模型。

本发明通过以一种直观有效的方式,同时在计算复杂低的情况下,从过程历史数据库中提取变量的时滞信息用于软测量建模数据重构,校正了输入输出间实际的因果对应关系,同时有效的解决了过程随机噪声的干扰,能够很好地提取过程时滞信息,相对于传统的不考虑时滞的在线模型,能够得到更加精确的预测结果。

实施例二:

本实施例提供一种带时延估计的加权高斯模型软测量建模方法,参见图2,本实施例以常见的化工过程——脱丁烷塔过程为例;实验数据来自于脱丁烷塔过程,对脱丁烷塔底部的丁烷浓度进行预测。

步骤1:获取历史采样输入和输出数据,组成历史训练数据库;根据过程机理和经验确定最大时延参数Tmax

步骤2:将训练样本数据进行归一化处理,通过滑动灰关联度分析(Moving greycorrelation analysis,MGRA)确定各输入变量的最优时延参数,定义为λ12,...,λm;其中m为样本的维度;

所述的滑动灰关联度算法为:

MGRA用于选择重要的输入变量:通过构建输入和输出变量之间的函数关系,从而确定对输出变量重要的输入变量。假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xi(t)为第t时刻样本的第i个变量,y(t)为对应的输出变量。

引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t-1),…,xi(t-λ),…,xi(t-Tmax)},其中t为输出变量的采样时刻,λ为待确定的时延变量,Tmax为最大的变量时延值。对于每个输入变量xi(t-λ),i=1,2,...,m在t时刻与其输出变量y(t)的关联系数定义为:

Δxλ,y=|xi(t-λ)-y(t)|(1)

式中,r(xi(t-λ),y(t))表示t时刻第i个变量时延值为λ的滑动灰关联度大小;ρ∈[0,1],为分辨系数。

通过式(1)得到n个样本的关联系数,对于一个整体的待比较数列而言,定义其灰关联度为:

对r(xi,λ,y)按大小进行排序,得到各个时延参数下,辅助变量对主导变量的重要程度;若得到的关联度r(xi,λ,y)越接近1,那么相对应的辅助变量xi(t-λ)对主导变量的贡献率越大。基于该原理,利用MGRA方法得到了各变量最优的时延参数估计值。

步骤3:对训练样本按照滑动灰关联度算法确定的时延参数进行数据重构。

步骤4:当查询样本xq到来时,在线对其建立加权高斯模型;

假设历史数据集中的输入样本xi与查询样本xq,相应的欧氏距离定义为:

其中,di是查询样本与第i个历史样本之间的距离。该距离越大,表示历史样本与查询样本的相关性越小,其对应的权重应越小。权重定义如下:

式中,δ为调整参数。

确定权重后,在查询样本周围构建加权高斯模型;

假设历史输入和输出联合向量为Z=[xT,yT]T,查询样本xq周围的输入和输出变量的联合密度分布服从高斯分布;

其中,θw={μw,Cw},μw、Cw分别表示权重为w下的均值和方差;

为确定最优参数,采用加权对数似然函数对参数进行估计:

对上述加权对数似然函数进行极大似然估计,得到加权高斯模型的最优参数为

在使用历史数据进行训练后,在查询样本周围得到一个加权高斯模型来描述输入和输出变量的联合密度分布;对于多变量高斯分布,根据联合向量Z将均值向量μw和协方差Cw分割成与其相对应的输入和输出部分;

其中,uw,x表示权重为w的历史输入样本的均值,uw,y表示权重为w的历史输出样本的均值,Cw,xx表示权重为w的历史输入样本的自协方差,Cw,yy权重为w的历史输出样本的自协方差。Cw,xy表示权重为w的历史输入输出样本的协方差。

对于特定的查询样本xq,输出变量的分布服从高斯分布。因此,查询样本的预测输出值和预测方差分别为

图9是脱丁烷塔底部的丁烷浓度预测值和实际值拟合曲线,并且与WGR、FCA-WGR、MGRA-GPR所建立的软测量模型进行了比较。

由图可知,基于滑动灰关联度算法和加权高斯模型的软测量建模方法能够有效地脱丁烷塔底部的丁烷浓度。

本发明通过以一种直观有效的方式,同时在计算复杂低的情况下,从过程历史数据库中提取变量的时滞信息用于软测量建模数据重构,校正了输入输出间实际的因果对应关系,同时有效的解决了过程随机噪声的干扰,能够很好地提取过程时滞信息,相对于传统的不考虑时滞的在线模型,能够得到更加精确的预测结果。

本发明实施例中的部分步骤,可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,如光盘或硬盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号