首页> 中国专利> 一种基于稀疏深度神经网络的工业数据非线性因果分析方法

一种基于稀疏深度神经网络的工业数据非线性因果分析方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于稀疏深度神经网络的工业数据非线性因果分析方法，包括以下步骤：(1)采集待检测工业过程中全部控制回路的过程输出信号；(2)选取一个过程输出信号作为输出变量，全部变量的各阶滞后作为输入变量，构建稀疏深度神经网络；(3)通过依次删减输入变量，逐个完成格兰杰因果检验，得到此过程输出信号的全部格兰杰原因；(4)重复步骤(2)和(3)，得到全部过程输出信号间的因果关系；(5)综合全部过程输出信号间的因果关系，定位故障源位置及故障传播路径。利用本发明，可以对工业过程的控制回路信号进行非线性因果分析，完成故障源的定位及故障传播路径的分析。

著录项

公开/公告号CN109407654A

专利类型发明专利
公开/公告日2019-03-01

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN201811563379.1
发明设计人谢磊;乔丹;苏宏业;
展开▼

申请日2018-12-20
分类号G05B23/02(20060101);
代理机构33224 杭州天勤知识产权代理有限公司;
代理人胡红娟
地址 310013 浙江省杭州市西湖区余杭塘路866号
入库时间 2024-02-19 07:49:49

法律信息

法律状态公告日

法律状态信息

法律状态
2020-08-04

授权

授权
2019-03-26

实质审查的生效 IPC(主分类):G05B23/02 申请日:20181220

实质审查的生效
2019-03-01

公开

公开

说明书

技术领域

本发明属于工业控制系统中的故障诊断领域，尤其是涉及一种基于稀疏深度神经网络的工业数据非线性因果分析方法。

背景技术

现代工业过程由成百上千个高度耦合的控制回路组成，其过程设备具有规模大、变量多、综合度高且长时间运行在闭环控制下等特点。因而，各个回路的实际控制性能与工业生产的质量、能耗以及操作的安全性息息相关，也是实现上层优化、调度和管理的基础。然而，由于控制回路中控制器的过整定、过程的非线性、阀门粘滞、外部扰动和模型失配等原因，只有三分之一的回路在实际操作中控制性能满足要求，其余三分之二的回路出现不同程度的控制性能问题。因而，对工业控制回路进行因果分析，对工业过程的故障诊断和控制性能的提升具有重要意义。

但是在典型的工业过程中，回路变量数目众多，若采用普通的非稀疏的因果分析方法，计算过程将十分复杂、计算结果也不够直观简洁，最终的应用效果和价值有限。而在实际过程中，存在直接或者强烈因果关系的变量只占总变量的小部分，同时只有部分变量是因果关系中关键变量。因而，对工业控制回路，采用稀疏因果分析的研究方法，实现对回路的关键因果关系的检测，可以达到高效、简洁、精准的目的。

若想通过对复杂工业过程的建模实现因果分析，需要知道完整的工艺流程、过程结构等基础知识，因此存在一定的难度。所以在实际应用中，还可以基于工业过程的数据实现因果分析。

根据原理不同，可将已提出的基于数据的因果分析方法大致分为三类：基于时滞关系的格兰杰因果分析、基于统计概率的条件概率因果分析以及基于因果信息不对称性的因果分析。

格兰杰因果关系最早由格兰杰提出并命名，是最经典也是最常用的因果分析概念。在时间序列情形下，两个变量X、Y之间的格兰杰因果关系定义为：若在包含了变量X、Y的过去信息的条件下，对变量Y的预测效果要优于只单独由Y的过去信息对Y进行的预测效果，即变量X有助于解释变量Y的将来变化，则认为变量X是变量Y的格兰杰原因。

传统的格兰杰因果分析需要对模型进行回归，这导致此分析方法依旧存在要求假设X与Y间为线性关系、变量间两两配对检验算法整体效率较低、模型的准确度(特别是模型的阶次)对结果存在影响等问题。

发明内容

本发明提供了一种基于稀疏深度神经网络的工业数据非线性因果分析方法，克服了传统格兰杰因果分析的计算效率低、只能检测线性因果关系的缺点，可以完成非线性因果关系的检验，且只需获取常规运行数据，无需过程机理知识。

一种基于稀疏深度神经网络的工业数据非线性因果分析方法，包括以下步骤：

(1)采集待检测工业过程中全部控制回路的过程输出信号；

(2)选取一个过程输出信号作为输出变量，全部变量的各阶滞后作为输入变量，构建稀疏深度神经网络；

(3)通过依次删减输入变量，逐个完成格兰杰因果检验，得到此过程输出信号的全部格兰杰原因；

(4)重复步骤(2)和(3)，得到全部过程输出信号间的因果关系；

(5)综合全部过程输出信号间的因果关系，定位故障源位置及故障传播路径。

本发明利用深度神经网络训练代替线性回归，可以检验出非线性因果关系，并加入分层组稀疏的约束，减少不必要的格兰杰因果检验次数，并实现滞后阶次的自动选择。通过本发明的方法，可以对工业过程的控制回路信号进行非线性因果分析，完成故障源的定位及故障传播路径的分析。

步骤(2)中，构建稀疏深度神经网络的过程为：

(2-1)选取一个过程输出信号X_i(t)作为输出变量，全部变量的各阶滞后X₁(t-1),X₁(t-2),…,X₁(t-K),…,X_p(t-1),X_p(t-2),…,X_p(t-K)作为输入变量，取前3/4时间的数据作为训练集，后1/4时间的数据作为测试集，设计包含三个隐层的全连接神经网络，选取ReLU激活函数；

其中，i＝1,2,…,p，表示待分析的变量的编号；K表示滞后阶次，p表示变量个数；

(2-2)定义该神经网络的损失函数，在均方误差的基础上添加损失函数为：

其中，T表示总时间长度，x_it表示第i个变量的当前值信号序列，x_(t-1):(t-K)表示全部变量的第1至第K阶滞后信号构成的信号矩阵，W表示神经网络的权重系数矩阵，表示输入层由第j组神经元中的第k个至第一隐层每一个神经元的权重系数，‖·‖_F表示矩阵的Frobenius范数；

(2-3)选取神经网络的反向传播优化算法为近端梯度法，具体公式为：

可以通过以下算法迭代得到：

2)对于h＝1,…,H，更新r_gh←(1-λ/||r_gh||₂)₊r_gh；

3)返回迭代结果r作为最优解

其中，代表迭代时参数目标值，为通过迭代得到的使得该目标函数最小的x作为迭代结果，λ为参数范围的阈值，r存储迭代结果，x_gh为经过第h次迭代得到的结果。

(2-4)生成会话，在训练集上反复运行反向传播优化算法，不断优化模型各层间的权重系数得到在训练集上损失函数最小的模型参数，计算其在测试集上的全均方误差。

步骤(3)的具体过程为：

(3-1)找出可能为输出变量的格兰杰原因的全部输入变量；

(3-2)轮流从找到的全部输入变量的各阶滞后

中成组地删去每个变量的各阶滞后X_ir(t-1),X_ir(t-2),…,X_ir(t-K),r＝1,2,…,n_i，将其余的信号作为输入变量，取前3/4时间的数据作为训练集，后1/4时间的数据作为测试集，设计包含三个隐层的全连接神经网络，选取ReLU激活函数；

(3-3)选取均方差作为该神经网络的损失函数，具体公式为：

其中，T表示总时间长度，x_it表示第i个变量的当前值信号序列，x_(t-1):(t-K)表示全部变量的第1至第K阶滞后信号构成的信号矩阵，W表示神经网络的权重系数矩阵；

(3-4)选取神经网络的反向传播优化算法为随机梯度下降法；

(3-5)生成会话，在训练集上反复运行反向传播优化算法，不断优化模型各层间的权重系数得到在训练集上损失函数最小的模型参数，计算其在测试集上的限制均方误差；

(3-6)利用步骤(3-5)得到的限制均方误差与步骤(2-4)得到的全均方误差，在格兰杰因果检验的框架下判定两个信号是否具有因果关系，具体方式为：

认为均方误差遵循自由度为q和(n-k)的F分布，其中，n是样本容量，q等于滞后项x的个数，即有约束回归中待估参数的个数，k是无约束回归中待估参数的个数；如果在选定的显著性水平α上计算的F值超过临界值Fα，则拒绝零假设，认为测试的可能为原因的输入变量是待分析输出变量的原因。显著性水平α是一个(0,1)区间的可变参数，默认值为0.05。

步骤(3-1)的具体步骤为：

找出输入层至第一隐层的权重系数均非0的神经元组对应的全部输入变量，若不存在这样的输入变量或仅有待分析的输出变量自身，则认为此待分析的输出变量不存在其它信号是它的格兰杰原因，直接结束步骤(3)；若找到的输入变量只有1个且不为带分析的输出变量自身，则认为找到的这个输入变量就是待分析的输出变量的格兰杰原因，直接结束步骤(3)；若找到的输入变量有多个，即为输出变量的格兰杰原因的全部输入变量。

步骤(3-6)中，所述格兰杰因果检验的框架为：

零假设H₀：测试的输入变量的各阶滞后信号的输入层权重系数均为0，不能判断它是待分析输出变量的格兰杰原因；

备择假设H₁：测试的输入变量的各阶滞后信号的输入层权重系数不均为0，认为它是待分析输出变量的格兰杰原因。

步骤(5)的具体过程为：

(5-1)根据步骤(4)得到的全部过程输出信号间的因果关系，绘制变量因果关系拓扑图；

(5-2)根据拓扑图确定故障源位置,若存在一个变量是一个或多个其它变量的原因变量，而不是其它变量的结果变量，则认为此变量是故障源所在位置；

(5-3)根据步骤(5-2)所定位的故障源所在位置及步骤(5-1)所得到的变量因果关系拓扑图，得到故障传播路径。

与现有技术相比，本发明具有以下有益效果：

1、本发明的分析方法无需外部附加信号激励，也不会对控制系统引入附加扰动，能够实现非侵入式的检测与诊断。

2、本发明用深度神经网络训练代替传统格兰杰因果分析中的线性回归，克服其对于变量间的关系为线性关系的要求，可以检验出非线性因果关系。

3、本发明构建的神经网络，在损失函数中加入分层组稀疏惩罚，减少不必要的格兰杰因果检验测试次数，提高算法效率；可以实现滞后阶次的自动选择，客服传统的格兰杰因果检验模型的准确度(特别是模型的阶次)对结果存在较大影响的问题。

4、本发明所提出的非线性因果分析算法在工业数据因果分析领域，具有较高的准确度和稳定性。

5、本发明完全采用数据驱动型的方法，无需过程先验知识，也不需要进行人工干预。

附图说明

图1为本发明实施例中TE过程及控制策略流程图；

图2为本发明一种基于稀疏深度神经网络的工业数据非线性因果分析方法的流程示意图；

图3a为本发明实施例中采集的待检测控制回路1至9的过程输出信号绘图；

图3b为本发明实施例中采集的待检测控制回路10至17的过程输出信号绘图；

图4为本发明实施例中利用本发明的方法得到的因果关系拓扑图结果。

具体实施方式

下面以TE过程仿真数据的因果分析为例，对各回路中存在持续厂级振荡的过程数据,利用稀疏神经网络进行非线性因果分析的方法做详细描述。需要指出的是，以下所述实施例旨在便于对本发明的理解，而对其不起任何限定作用。

TE过程共有41个包含测量噪声的测量变量和12个操作变量(11个阀门流量信号及反应器搅拌速率信号)。主要控制目标包括：产物流率、产物流中的G组分含量、反应器压力、反应器液位、分离器液位、汽提塔液位等保持在设定值。其19个控制回路的控制策略如图1及表1所示。

表1

其中，第18、19控制回路为提升系统稳定性的超驰控制，限制反应器的最大压力及最高液位，仿真中暂不加入，仅考虑前17个回路的控制。在第16回路反应器温度回路中添加了持续的振荡噪声信号以模拟故障的发生，噪声信号为周期正弦信号与有色噪声信号的叠加。

如图2所示，一种基于稀疏神经网络的工业数据非线性因果分析方法，包括：

步骤1，采集待检测工业过程的各回路输出信号。

采集过程输出信号的方法为，在预设的每个采样间隔内记录下待检测的控制回路中的过程数据，且每个采样间隔内采集到的过程数据都添加在先前已经采集到的过程数据末端。

采样间隔是指性能评估系统的采样间隔。过程数据随着时间推移不断更新，每经过一个采样间隔的时间长度，均有新的过程数据添加到先前采集的过程数据的末端。性能评估系统的采样间隔一般与工业控制系统中的控制周期相同，也可以选择为控制周期的整数倍，具体根据性能监控和工业现场的实时性要求和数据存储量限制来确定。

本实施例所采集的过程输出信号经过归一化后如图3a、图3b所示，图中横坐标为采样点序数，单位为Sample(1个Sample对应一个数据的采样间隔)，纵坐标为经过归一化后的数据，无量纲。

步骤2，选取全部过程输出变量中的一个过程输出时序信号作为神经网络的输出变量，全部变量的各阶滞后作为神经网络的输入变量，构建稀疏深度神经网络。具体过程如下：

步骤2-1，选取其中一个过程输出信号X₁(t)作为输出变量，全部变量的各阶滞后X₁(t-1),X₁(t-2),…,X₁(t-5),…,X₁₇(t-1),X₁₇(t-2),…,X₁₇(t-5)作为输入变量，取前3/4时间的数据作为训练集，后1/4时间的数据作为测试集，设计包含三个隐层的全连接神经网络，选取ReLU激活函数；

步骤2-2，定义神经网络的损失函数，在均方误差的基础上添加损失函数为

其中，T表示总时间长度，x_it表示第i个变量的当前值信号序列，x_(t-1):(t-5)表示全部变量的第1至第K阶滞后信号构成的信号矩阵，W表示神经网络的权重系数矩阵，表示输入层由第j组神经元中的第k个至第一隐层每一个神经元的权重系数，‖·‖_F表示矩阵的Frobenius范数；

步骤2-3，选取神经网络的反向传播优化算法为近端梯度法，具体公式为：

可以通过以下算法迭代得到：

1)；2)对于h＝1,…,H，更新r_gh←(1-λ/||r_gh||₂)₊r_gh；3)返回迭代结果r作为最优解

步骤2-4，生成会话，在训练集上反复运行反向传播优化算法5000次，不断优化模型各层间的权重系数得到在训练集上损失函数最小的模型参数。计算其在测试集上的全均方误差为0.000581209。

步骤3，通过依次删减输入变量，逐个完成格兰杰因果检验，得到此待检测变量的全部格兰杰原因。具体过程为：

步骤3-1，找出所有可能成为神经网络输出信号的变量的格兰杰原因的变量，依次做格兰杰因果检验。可能成为其原因的信号X_j(t)具有特点为，该信号的各阶滞后神经元X_j(t-1),X_j(t-2),…,X_j(t-5)到第一隐层的权重系数(表示输入层由第j组神经元中的第k个至第一隐层每一个神经元的权重系数)均非0。包括变量1、9、10、14、15、16，对这些可能的原因变量依次在置信水平1-α下做格兰杰因果检验。

所设计的格兰杰因果假设检验框架为：

零假设(H₀)：测试的可能的原因变量的各阶滞后信号的输入层权重系数均为0，不能判断它是待分析变量的格兰杰原因；

备择假设(H₁)：测试的可能的原因变量的各阶滞后信号的输入层权重系数不均为0，认为它是待分析变量的格兰杰原因。

步骤3-2，例如对变量9是否是变量1的原因做假设检验，取待分析的过程输出信号X₁(t)作为输出变量，取其余可能的原因变量的各阶滞后X₁(t-1),X₁(t-2),…,X₁(t-5),X₁₀(t-1),X₁₀(t-2),…,X₁₀(t-5),X₁₄(t-1),X₁₄(t-2),…,X₁₄(t-5),X₁₅(t-1),X₁₅(t-2),…,X₁₅(t-5),X₁₆(t-1),X₁₆(t-2),…,X₁₆(t-5)作为输入变量，取前3/4时间的数据作为训练集，后1/4时间的数据作为测试集，设计包含三个隐层的全连接神经网络，选取ReLU激活函数；

步骤3-3，取计算均方误差作为损失函数

步骤3-4，选取神经网络的反向传播优化算法为随机梯度下降法；

步骤3-5，生成会话，在训练集上反复运行反向传播优化算法，计算其在测试集上的限制均方误差为0.0382292；

步骤3-6，利用限制均方误差0.0382292与全均方误差0.000581209，在假设检验的框架下判定变量9是变量1的格兰杰原因。

重复步骤3-2至3-6，得到变量1的全部格兰杰原因包括变量9、14、15、16。

步骤4，重复步骤2、3，得到全部过程输出信号间的因果关系，得到因果关系拓扑图如图4所示；

步骤5，综合全部过程输出信号间的因果关系，变量16是多个变量的原因，但本身又不作为其它变量的结果，可以认为故障源位于回路16中，这与实际故障源位置是一致的。故障由回路16传递至1、6、10、17等回路，最终导致厂级振荡，其结果可以基于控制方案及物理连接得到合理的解释。验证了利用本发明对工业数据进行非线性因果分析的有效性及结果的合理性。

以上所述的实施例对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的具体实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于稀疏深度神经网络的工业数据非线性因果分析方法 [P] . 中国专利： CN109407654B . 2020-08-04
2. Nonlinear sparse representation-based classification for foveated analysis of spectral data with distortions [P] . 美国专利： US10176407B1 . 2019-01-08

机译：基于非线性稀疏表示的分类，用于偏光分析光谱数据
3. Method and system for analyzing sequential data based on sparsity and sequential adjacency [P] . 美国专利： US9275483B2 . 2016-03-01

机译：基于稀疏性和顺序邻接性的顺序数据分析方法和系统
4. SYSTEM AND METHOD FOR DETERMINATION OF CAUSALITY BASED ON BIG DATA ANALYSIS [P] . 美国专利： US2014156628A1 . 2014-06-05

机译：基于大数据分析的因果关系确定系统和方法