首页> 中国专利> 双层数据模型驱动的厂级化工过程监测方法

双层数据模型驱动的厂级化工过程监测方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种双层数据模型驱动的厂级化工过程监测方法。本发明在分块建模的基础上，通过构建一个双层数据统计分析模型，完成子模块之间关系的建模，从而实现厂级过程的全局监测。相比目前的其它厂级过程监测方法，本发明不仅可以在各个子模块内对过程的各个单元进行监测，而且可以有效地结合厂级过程各个子模块之间的关系信息，利用第二层数据模型对整个厂级过程的全局进行监测，大大提高了厂级化工过程的监测性能，非常有利于厂级过程工业自动化的扩展和实施。

著录项

公开/公告号CN102880151A

专利类型发明专利
公开/公告日2013-01-16

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN201210387023.3
发明设计人葛志强;宋执环;
展开▼

申请日2012-10-11
分类号G05B19/418;
代理机构杭州求是专利事务所有限公司;
代理人周烽
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2024-02-19 17:04:01

法律信息

法律状态公告日

法律状态信息

法律状态
2019-10-08

未缴年费专利权终止 IPC(主分类):G05B19/418 授权公告日:20150211 终止日期:20181011 申请日:20121011

专利权的终止
2015-02-11

授权

授权
2013-02-27

实质审查的生效 IPC(主分类):G05B19/418 申请日:20121011

实质审查的生效
2013-01-16

公开

公开

说明书

技术领域

本发明属于化工工业生产过程的安全监测和质量控制领域，特别涉及一种双层数据模型驱动的厂级化工过程监测方法。

背景技术

随着现代化工过程生产规模的日益扩大，一种新型的厂级过程越来越引起人们的关注。针对厂级过程的建模、监测和控制也随之得到了学术界和工业界的广泛关注。一个典型的厂级过程通常包含多个操作单元、多个流程装置，甚至囊括多个操作车间。如此复杂的大型化工过程，采用传统的基于机理模型的监测方法将会非常困难。相比之下，由于过程中积累了大量的数据，基于数据的建模和监测方法更加适合与复杂大型的厂级过程。目前常用的厂级过程监测方法大多都是建立在数据驱动模型的基础上，在这一大类方法中，通常先将整个厂级过程按照操作单元和功能划分为多个子模块，然后分别针对不同的子模块建立基于数据的监测模型对过程进行分块监测。但是，该类方法往往忽略了子模块之间的相互关系，而这种关系有可能影响到整个厂级过程的监测性能。因此，如果能在子模块数据建模的基础上，再对它们之间的相互关系建立一个模型，将会大大提高数据模型对厂级过程信息的捕捉能力。同时，基于一个双层数据模型的监测系统，将会对厂级过程的全局和局部操作状态同时作出实时监测，非常有利于厂级过程的自动化实施。

发明内容

本发明的目的在于针对现有厂级过程监测方法的不足，提供一种双层数据模型驱动的厂级化工过程监测方法。

本发明的目的是通过以下技术方案来实现的：一种双层数据模型驱动的厂级化工过程监测方法，包括以下步骤：

（1）利用集散控制系统收集厂级化工过程的数据组成建模用的训练数据样本集：X∈R^n×m。其中，n为样本数据集的个数，m为样本数据集的变量个数。

（2）将整个厂级过程数据集X∈R^n×m分为不同的子模块其中b=1,2,…,B为子模块的序号，B为总的子模块个数。将这些子模块数据集存入数据库备用。

（3）针对每一个子模块对应的数据集，对其进行归一化处理，建立基于主元分析的数据统计监测模型，提取主元信息，建立子模块的监测统计量及其监测限。

（4）得到各个子模块的主元信息之后，对其重新进行排列，组合成新的数据集用于构建第二层数据统计分析模型。

（5）针对混合主元信息的新数据矩阵，采用单类支持向量机对其进行建模，建立各个子模块之间的关系模型，完成厂级过程的整体建模和监测。

（6）收集新的过程数据，并对其进行预处理和归一化。

（7）将新的过程数据划分为多个子模块，输入到子模块主元模型中，计算相应的主元成分。

（8）重新组合不同子模块的主元信息，将新的数据矩阵输入到单类支持向量机模型中，计算相应的监测统计量值，判断当前过程的运行状态。

本发明的有益效果是：本发明通过对厂级过程构建双层数据统计分析模型，克服了传统分块建模方法的缺陷，建立了厂级过程中各个子模块之间的关系模型，并引入单类支持向量机构建一个新的距离统计量用于过程监测。相比目前的其它厂级过程监测方法，本发明不仅可以在各个子模块内对过程的各个单元进行监测，而且可以有效地结合厂级过程各个子模块之间的关系信息，利用第二层数据模型对整个厂级过程的全局进行监测，大大提高了厂级化工过程的监测性能，非常有利于厂级过程工业自动化的扩展和实施。

附图说明

图1是厂级化工过程的流程图；

图2是本发明方法中对厂级过程中正常数据集的监测结果；

图3是本发明方法中对厂级过程中异常数据集的监测结果；

图4是传统主元分析模型中对厂级过程中异常数据集的监测结果。

具体实施方式

本发明针对厂级化工过程的监测问题，首先利用集散控制系统收集该过程的数据，对其进行必要的预处理和归一化，然后将整个过程数据集分为不同的子模块。针对每一个子模块对应的数据集，分别建立一个的主元分析模型，并建立监测统计量的控制限。得到各个子模块数据集对应的主元信息之后，将其重新组合成新的数据集，然后采用单类支持向量机对其进行建模。对新的过程数据进行监测的时候，同样将该数据分为不同的子模块，利用每一个子模块建模数据的均值和标准差对其进行归一化处理，得到标准数据之后，再利用各个子模块的主元分析模型计算新数据在不同子模块中的主元信息。将子模块中得到的所有主元信息重新组合，输入到第二层的单类支持向量机模型中，计算距离监测统计量的值，实现对厂级过程的全局监测。

本发明采用的技术方案的主要步骤分别如下：

第一步利用集散控制系统收集厂级化工生产过程的数据组成建模用的二维训练样本集：X∈R^n×m。其中，n为样本数据集的个数，m为样本数据集的变量个数，R为实数。

第二步按照过程的操作单元类型和相关的功能属性，将步骤1得到的二维训练样本集X∈R^n×m分为不同的子模块：其中b=1,2,…,B，为子模块的序号，B为总的子模块个数。将这些子模块数据集存入数据库备用。

第三步针对每一个子模块对应的数据集，对其进行归一化处理，建立基于主元分析的数据统计监测模型，提取主元信息，建立子模块的监测统计量及其监测限。

对每一个子模块对应的数据集b=1,2,…,B进行预处理和归一化，即使得各个过程变量的均值为零，方差为1，得到新的数据矩阵集。该步骤的主要目的是为了使得过程数据的尺度不会影响到监测的结果。通过归一化之后，不同过程变量的数据就处在相同的尺度之下，既而不会影响到后续的监测效果。然后，对该数据集进行主元分析，把原空间分为主元空间和残差空间，选取合适的主元个数，得到的载荷矩阵P_b和得分矩阵T_b，并获得建模的残差，即：

$> X_{b} = T_{b} \cdot P_{b}^{T} + {\tilde{T}}_{b} \cdot {\tilde{P}}_{b}^{T}$ >

在主元分析模型的基础上，通过构造以下两个统计量T²和SPE来实现对各个子模块内部的监测：

$> T_{b}^{2} = t_{b}^{T} Λ_{b} t_{b};$ > $> {SPE}_{b} = e_{b}^{T} e_{b},$ >

其中，t_b为子模块得分矩阵T_b中的向量，对应于一个子模块数据的主元变量，为该数据的估计残差。为了对数据的状态进行监测，我们需要建立和SPE_b统计量的监测统计限和SPE_b，lim，即：

$> T_{b, \lim}^{2} = \frac{k_{b} (n - 1)}{n - k_{b}} F_{k_{b}, (n - k_{b}), α};$ > $> {SPE}_{b, \lim} = g_{b} χ_{n_{b}, α}^{2};$ >

其中，F代表F形式的统计分布，x²为x²形式的统计分布，α为统计置信度，g_b=var(SPE_b)/[2mean(SPE_b)]，h_b=2[mean(SPE_b)]²/var(SPE_b)，其中mean(SPE_b)和var(SPE_b)分别为SPE_b统计量的均值和方差。分别对b=1,2,…,B的不同子模块进行建模，完成第一层数据模型的构建。

第四步得到各个子模块的主元信息b=1,2,…,B之后，对其重新进行排列，组合成新的数据集用于构建第二层数据统计分析模型，即：

T_com=[T₁T₂…T_b…T_B]。

第五步针对混合主元信息的新数据矩阵，采用单类支持向量机对其进行建模，建立各个子模块之间的关系模型，完成厂级过程的整体建模和监测。

针对二维混合主元数据矩阵T_com，建立单类支持向量机数据分析模型。首先利用非线性函数将过程数据投影到高维特征空间中，即单类支持向量机通过求解下面的优化命题建立模型：

$> \min_{R, a, ξ} R^{2} + C Σ_{i = 1}^{n} ξ_{i}$ >

$> s . t . {| | Φ (t_{i}) - a | |}^{2} \leq R^{2} + ξ_{i}, ξ_{i} \geq 0, i = 1,2, \cdot \cdot \cdot, n$ >

其中，R和a分别是高维特征空间中超球体的半径和球心，Φ(t_i)为非线性投影函数，C为单类支持向量机参数，通过此参数，单类支持向量机会在超球体的体积和样本的错分率之间取得平衡，ξ为每个样本的松弛变量。在实际的求解过程中，通常采用以下的对偶命题来构造单类支持向量机，即：

$> \min_{α_{i}} Σ_{i = 1}^{n} α_{i} K (t_{i}, t_{j}) - Σ_{i = 1}^{n} Σ_{j = 1}^{n} α_{i} α_{j} K (t_{i}, t_{j});$ >

$> s . t . 0 \leq α_{i} \leq C, Σ_{i = 1}^{n} α_{i} = 1$ >

其中，K(t_i,t_j)=〈Φ(t_i),Φ(t_j)>是核函数，通常选取为高斯核函数的形式，α为每个样本对应的系数，即拉格朗日乘子。单类支持向量机的建模结果是：大部分样本对应的α值为零，只有小部分关键样本对应的α值不为零，这些样本被称为支持向量。

在高维特征空间中，求取超球体的的球心和半径如下：

$> a = Σ_{i = 1}^{n} α_{i} Φ (t_{i}),$ >

$> R = \sqrt{1 - 2 Σ_{i = 1}^{n} α_{i} K (t_{0}, t_{i}) + Σ_{i = 1}^{n} Σ_{j = 1}^{n} α_{i} α_{j} K (t_{i}, t_{j})},$ >

其中，t₀为单类向量机模型中的其中一个支持向量。

第六步收集新的过程数据，并对其进行预处理和归一化。

第七步将新的过程数据划分为多个子模块，输入到子模块主元模型中，计算相应的主元成分。

首先，将新的过程数据x^new划分为多个子模块，即

$> x^{new} = (\begin{matrix} x_{1}^{new} & x_{2}^{new} & \cdot \cdot \cdot & x_{b}^{new} & \cdot \cdot \cdot & x_{B}^{new} \end{matrix})$ >

将不同的子模块数据向量输入到对应的子模块主元模型中，计算相应的主元成分如下

$> t_{1}^{new} = P_{1}^{T} x_{1}^{new},$ > $> t_{2}^{new} = P_{2}^{T} x_{12}^{new},$ >...， $> t_{B}^{new} = P_{B}^{T} x_{B}^{new}$ >

第八步重新组合不同子模块的主元信息，将新的数据矩阵输入到单类支持向量机模型中，计算相应的监测统计量值，判断当前过程的运行状态。

将各个子模块数据向量对应的主元信息组合如下：

$> t_{com}^{new} = (\begin{matrix} P_{1}^{T} x_{1}^{new} & P_{2}^{T} x_{2}^{new} & \cdot \cdot \cdot & P_{b}^{T} x_{b}^{new} & \cdot \cdot \cdot & P_{B}^{T} x_{B}^{new} \end{matrix}),$ >

在此基础上，将得到的新主元混合数据向量输入到单类支持向量机模型中，在高维空间中，计算该数据向量到超球体球心的距离，即：

$> D_{new} = d (Φ (t_{com}^{new})) = | | Φ (t_{com}^{new}) - a | | = \sqrt{1 - 2 Σ_{i = 1}^{n} α_{i} K (t_{com}^{new}, t_{i}) + Σ_{i = 1}^{n} Σ_{j = 1}^{n} α_{i} α_{j} K (t_{i}, t_{j})},$ >

当D_new≤D_lim=R时，说明厂级过程的运行状态良好，当前没有故障发生，相反，如果D_new>D_lim=R时，说明该监测统计量已经超越其统计控制限，厂级过程有可能发生了某种故障，需要给过程提供报警信息。

下面结合一个具体的厂级化工生产过程例子来说明本发明方法的有效性。该过程的流程图如图1所示，整个过程由5个不同的操作单元组成。选取33个主要过程变量用于该厂级过程的监测，如表1所示，按照过程操作单元功能和变量的对应信息，将监测变量划分为3个不同的子模块，这是因为其中有两个操作单元的变量过少，并且和相邻的操作单元耦合性较强，因此将他们划入到其它的操作单元中。在过程中一共采集960个数据点用于建模，接下来结合该具体过程对本发明的实施步骤进行详细地阐述：

1.收集过程数据，数据预处理，厂级过程分块，子模块主元分析模型构建（第一层数据模型构建）

对收集到的960个有效正常数据样本进行预处理，去掉均值和方差，并将其分为三个不同的子模块，分别对应16个、10个和7个过程变量。这样，得到的子模块数据集分别为X₁∈R^960×16，X₂∈R^960×10和X₃∈R^960×7。然后，分别针对每一个子模块数据集，建立其主元统计分析模型，利用累积方差贡献率原则，即主元的累积数据解释程度超过85%，选取的主元个数分别为11个、5个和3个，累积方差贡献率分别为88.72%、91.64%和90.54%。另外，各个主元分析模型得到的T²和SPE统计量的统计限分别为25.1908和8.3297（第一个子模块），15.2452和4.9734（第二个子模块），11.4300和5.6033（第三个子模块）。

2.基于单类支持向量机的厂级过程全局建模（第二层数据模型构建）

将各个子模块得到的主元信息重新进行组合，得到以下新的主元数据矩阵，利用单类支持向量机对其进行建模，在高维空间中确定超球体的球心的位置和半径的大小。选取参数的时候，使得错分率控制在1%左右，这样所得的监测统计量就代表了99%的置信限。在高维特征空间中，最终得到的超球体的半径大小为0.7059。

3.获取当前监测数据信息，并对其进行预处理和归一化

为了测试新方法的有效性，分别对正常数据集和异常数据集进行测试，其中，正常数据集包含500个数据点，异常数据集包含960个数据点(其中前面160个为正常数据，之后800个为异常数据)，首先是利用模型库中的均值和方差对其进行归一化处理，使得该测试数据和建模数据具有相同的尺度。

4.厂级化工生产过程的在线监测

首先将正常数据集中的每一个测试数据分为三个不同的子模块数据向量，利用各个子模块对应的主元分析模型对其进行主元信息提取。得到各个子模块的主元信息之后，对其重新进行组合，输入到单类支持向量机模型中，在高维特征空间中，计算其与超球体球心的距离，即距离统计量的值，并与半径相比较，得到实时监测结果，如图2所示。由该图可以看出，双层数据模型对正常数据的监测结果还是比较满意的，误报的数据量基本在1%左右，符合建模的假设。接下来对异常数据集进行监测，结果如图3所示，由图中可以看出，从160个采样点之后，双层数据模型已经成功监测到厂级过程的异常，并在之后持续给出报警信息。相比之下，如果我们采用传统的主元分析模型进行监测的话，监测性能将会大大降低，如图4所示。这也说明了我们在第二层数据建模时引入单类支持向量机是合适的，也是有效的。

表1：厂级过程监测变量列表

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 双层数据模型驱动的厂级化工过程监测方法 [P] . 中国专利： CN102880151B . 2015.02.11
2. 双层数据模型驱动的厂级化工过程监测方法 [P] . 中国专利： CN102880151A . 2013-01-16
3. METHOD OF AUTOMATICALLY OFFERING DATA FOR FOCAL MONITORING OF LITHOGRAPHIC PROCESS [P] . 日本专利： JP2006222432A . 2006-08-24

机译：自动提供数据的岩相过程重点监测方法
4. METHOD FOR MONITORING PROCESS DATA OF MULTI CHAMBER EQUIPMENT [P] . 韩国专利： KR100456395B1 . 2004-11-10

机译：多室设备过程数据的监测方法
5. METHOD FOR MONITORING PROCESS DATA OF MULTI CHAMBER EQUIPMENT [P] . 韩国专利： KR20030078993A . 2003-10-10

机译：多室设备过程数据的监测方法