技术领域
本发明涉及自动化技术领域,尤其涉及一种基于迭代多输出-马尔科夫链的空分系统氩馏分变量多步预测方法。
背景技术
空气分离是指通过膨胀、精馏等物理或化学反应,在低温条件下将空气分离为氮气、氧气和氩气的过程。空气分离过程是一种流程工业,生产过程连续进行且机理复杂,其中的一些关键指标变量数据是设备和工艺工况的重要体现。工业现场人员通常依据关键指标的变化趋势调节相关设备的运行,从而保障生产过程安全平稳运行。然而在实际的生产现场,一些重要指标难以实时检测或全面检测,使整体的工况调节和计划调度受到负面影响。如果能够通过数学建模方法对关键指标变量进行实时预测并预知其未来的变化趋势,将会为工业生产的正常运作与实时调度提供十分重要的信息,因此建立精确稳定的生产过程变量短期预测模型是必要且有意义的。传统的生产过程主要依据能量守恒定律、热力学定律及动力学方程等机理分析建立指标预测模型,但是空分生产过程涉及到多种物理化学反应,过程复杂、时变性强,预测变量的机理建模难度较大、可靠性低,并且建模方法的泛化能力一般。现代化工业生产现场的控制系统能够采集大量包含生产信息的数据,基于数据驱动的预测建模方法通过建立输入与输出变量的关系模型达到预测的目的,而无需对系统的机理信息过多关注,因此成为了实现生产过程指标变量预测的有效途径。变量的短期预测通常根据预测步长分为单步预测和多步预测。相较于单步预测,多步预测能够实现更长时间的指标趋势预测,提供更多的有效信息,但同时也伴随着更多的不确定性和随机性。
例如,中国专利CN95116365.5公开了空气分离系统的模型预测控制方法。该申请对于空气分离采用中间产物预测,但是其预测结果依然存在较大的不确定性和随机性。
发明内容
本发明主要解决现有的技术中空气分离对于预测结果存在较大的不确定性和随机性的问题;提供基于迭代多输出-马尔科夫链的空分系统氩馏分变量多步预测方法,降低预测结果的随机性,提高预测精度,具有较好的适用性。
本发明的上述技术问题主要是通过下述技术方案得以解决的:基于迭代多输出-马尔科夫链的空分系统氩馏分变量多步预测方法,包括以下步骤:
S1:采集数据,构建数据集,将数据集进行归一化处理,并划分为训练集、验证集和测试集;
S2:构建迭代多输出预测模型;
S3:采用马尔科夫链进行误差校正。从空分工业现场的监控与数据采集系统中获取氩馏分指标变量一段连续的时间序列数据,将数据集进行归一化,并划分为训练集、验证集和测试集,将训练集用于预测模型的训练,将测试集用于验证预测模型的效果,验证集用于评估训练模型,经过多输出预测模型和误差校正后提高空气分离结果的预测精度。
作为优选,步骤S2中构建迭代多输出预测模型具体包括以下步骤:
S21:建立迭代多输出神经网络预测模型;
S22:确定迭代多输出预测模型的最优参数。
作为优选,步骤S21中建立迭代多输出神经网络预测模型的具体方法为:采用具有较强的非线性拟合能力的人工神经网络作为指标变量的迭代多输出预测模型,设定模型的输入维度为m,隐含层节点数为p,输出维度为s,训练模型表示为:
[y
式中,s>1时,F:R
其中q∈{1,…,n},ceil(X)表示X向上取整,[y
预测过程中,预测模型在已有的真实输入数据基础上,进行一次输出步长为s的多步预测,模型的多个输出值将成为下次预测的输入变量。从第二次预测开始,模型的输入变量包含了预测数据,以此展开迭代直到完成H步的数据预测。
作为优选,步骤S22中确定迭代多输出预测模型的最优参数的具体方法为:确定隐含层节点数:
在不同输入维度m、隐含层节点数p、输出维度s的参数组合下,根据平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)进行误差评价,得到最小误差,获得最优网络结构参数,其具体计算式为:
其中,n是样本量,y
作为优选,步骤S3中采用马尔科夫链进行误差校正的具体方法包括以下步骤:
S31:建立转态转移矩阵;
S32:预测值校正。
作为优选,步骤S31中将预测值与真实值的相对误差根据其分布密度划分为n个状态区间,记为S
式中,M
作为优选,步骤S32中从预测数据点的相邻实测点开始,连续取N个实际值,N的取值与状态区间的个数相同(N=n),根据实测点距离预测点的时步间隔,将转移步数设定为i=1,2,…n,转移步数i对应的实测点的起始状态为S
式中,f(x)表示预测模型的预测值;Δ
本发明的有益效果是:本发明将迭代多输出法与马尔科夫链结合,一方面通过参数寻优的方式确定预测模型的最佳输入输出维度,有效减少模型的迭代误差累积,增强模型的适用性与灵活性;另一方面,马尔科夫链能够通过计算预测值的误差状态确定其校正范围和方向,使预测值与真实值的偏离程度更小,预测精度更高,本发明对于空分系统的变量时间序列多步预测具有较好的适用性。
附图说明
图1是本发明实施例的多步预测方法的流程图。
图2是本发明实施例的输出维度s=3时不同网络结构的均方根误差示意图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:A省某大型空分制氩系统配备的分布式控制系统(Distributed ControlSystem,DCS)采集、存储了监测指标变量的数据。现以该系统的氩馏分变量的时间序列数据为实例,说明本发明方法。
一种基于迭代多输出-马尔科夫链的空分系统氩馏分变量多步预测方法,如图1所示,包括以下步骤:
步骤S1:构建数据集。选取2020年某10天氩馏分变量的连续生产数据,此指标变量的数值变化范围为9%~11%,数据采样周期为1分钟。将数据集进行归一化,其中前8天的数据作为训练集进行预测模型的训练建模,第9天的数据作为验证集评估训练模型,第10天的数据作为测试集用于验证预测模型效果。
步骤S2:构建迭代多输出预测模型。
2.1建立迭代多输出神经网络预测模型。采用具有较强的非线性拟合能力的人工神经网络作为指标变量的迭代多输出预测模型,设定模型的输入维度为m,隐含层节点数为p,输出维度为s,训练模型表示为:
[y
式中,s>1时,F:R
其中q∈{1,…,n},ceil(X)表示X向上取整,[y
2.2确定迭代多输出预测模型的最优参数。为了获得性能良好的迭代多输出预测模型,需要对输出维度及其对应的输入维度和隐含层单元数进行参数寻优。确定隐含层节点数:
在不同输入维度m、隐含层节点数p、输出维度s的参数组合下,根据平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)进行误差评价,得到最小误差,获得最优网络结构参数,其具体计算式为:
其中,n是样本量,y
使用后验法进行迭代多输出法的模型结构参数寻优:在不同输入维度m、隐含层节点数p、输出维度s的参数组合下,预测模型达到最小误差时对应的参数组合即是模型的最优网络结构参数。不同输出维度s对应的最小预测误差指标如下表所示。
表1不同输出维度s对应的最小预测误差指标
输出维度s=3时,三种误差指标均达到了最小值,表明该输出维度的预测模型能较好地描述多步预测过程中变量相邻数据的关联性。图2展现了s=3时不同网络结构的均方根误差(RMSE),其最优参数的输入维度m=3,隐含层节点数p=13。
步骤S3:采用马尔科夫链进行误差校正;3.1建立转态转移矩阵。将预测值与真实值的相对误差根据其分布密度划分为n个状态区间,记为S
式中,M
对最优参数的神经网络完成训练之后,需要确定预测值的误差状态区间,进而确定预测值的误差校正方向。选取最新预测点的前30个样本点进行状态区间划分,根据30个样本点的预测值与真实值的相对误差范围和分布情况,将误差区间划分为3个区间,分别为S
表2样本点的相对误差及状态
在3个误差区间中,S
3.2预测值校正。从预测数据点的相邻实测点开始,连续取N个实际值,N的取值与状态区间的个数相同(N=n),根据实测点距离预测点的时步间隔,将转移步数设定为i=1,2,…n,转移步数i对应的实测点的起始状态为S
式中,f(x)表示预测模型的预测值;Δ
表3第31时步的相对误差状态预测表
已知第31时步的实际值和预测值分别为10.3700和10.3427,得到校正后的预测值为:
在基于迭代多输出-马尔科夫链的预测模型中,神经网络多维输出的第一个预测值被校正的同时,也获得了此数据点的误差状态,因此能够继续对后续时刻的预测值进行校正。对于第32和33时步的预测值校正结果如下表所示。
表4氩馏分变量第31-33时步的预测值比较
由表4可知基于迭代多输出-马尔科夫链的空分系统氩馏分变量多步预测方法相较于没有进行误差校正的迭代多输出法而言,预测值与真实值的相对误差更小,预测值更加接近实际值,误差校正的优势明显。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
机译: 多输入多输出系统中基于统一迭代树搜索的低复杂度检测装置及方法
机译: 多输入多输出系统中基于统一迭代树搜索的低复杂度检测装置及方法
机译: 基于迭代模糊搜索的数据库和多变量比较来控制交互和生成警报