首页> 中国专利> 一种流程对象原始数据时序发现与调整方法

一种流程对象原始数据时序发现与调整方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种流程对象原始数据时序发现与调整方法，包括：数据取样步骤，对流程对象各环节测点在时间T内采集到的原始数据集进行抽样，抽取单位时间段内变化量最大的数据片段作为样本数据；时序发现步骤，以任意环节测点为基测点，计算其与其他环节测点间的时间距，从而获得包含所有环节测点时间顺序的时间序列L；时序调整步骤，根据时间序列L对各环节测点原始数据进行时序调整。本发明对原始数据进行抽样、发现时序并调整时序，具有简单、精确、人为干预少的优点，以解决现有流程工业中原始数据错漏较多，无法体现各个环节间的相互影响关系的问题。

著录项

公开/公告号CN104346169A

专利类型发明专利
公开/公告日2015-02-11

原文格式PDF
申请/专利权人济南大学;
展开▼

申请/专利号CN201410542448.6
发明设计人郭庆北;朱连江;曲守宁;杜韬;张坤;程新功;王钦;张勇;王凯;
展开▼

申请日2014-10-14
分类号G06F9/44;
代理机构济南舜源专利事务所有限公司;
代理人赵佳民
地址 250022 山东省济南市市中区南辛庄西路336号
入库时间 2023-12-17 04:14:53

法律信息

法律状态公告日

法律状态信息

法律状态
2019-10-08

未缴年费专利权终止 IPC(主分类):G06F9/44 授权公告日:20170616 终止日期:20181014 申请日:20141014

专利权的终止
2017-06-16

授权

授权
2015-03-11

实质审查的生效 IPC(主分类):G06F9/44 申请日:20141014

实质审查的生效
2015-02-11

公开

公开

说明书

技术领域

本发明涉及流程工业生产领域，尤其涉及流程工业中的一种流程对象原始数据时序发现与调整方法。

背景技术

在流程工业生产中，生产过程根据工业要求由一个个环节构成的，各个环节具有传递性，每个环节通常需要加装许多检测装置，通过数据接口，将检测数据传入数据存储计算机中，数据量巨大，利用这些数据进行优化工业控制流程、辅助控制决策的需求不断增加；而且流程工业的数据采集是基于一定频率的，各个环节采集到的数据是相互联系的，并且是相互制约的，流程工业中的各个环节具有时序特征，但是由于状态传播的延迟，使采集到的数据不具有时序性，相同时刻的各环节数据不是该时刻对其他环节产生响应的数据，表现出了不同步的特性，直接用该数据进行后续运算不会反映出流程数据的时序性；时序运算，即找出流程对象各测点之间的时序，并求出时序流程不同测点之间的延迟时间，一直是研究热题；然而由于在流程工业生产过程中，常常因其煅烧过程和物料的复杂性，还存在着一些复杂而且目前还不可检测的环境因素，工作环境的限制与信息采集技术的不完善，导致获得的原始数据间时序特征不明显且存在大量的噪声与错漏数据，导致从原始数据中获取知识非常困难，因此迫切需要对原始数据进行规范化处理。

流程对象通常具有以下特性：1、多环节性，一个流程对象，通常由诸多环节构成，每个环节根据工艺要求前后相连，前一环节的输出是它下一环节的输入；2、单向向前相关性，我们可以将一个流程看作一个开环系统(通常在工业过程中，局部的闭环控制可以视为一个环节)，对于一个开环系统，每个环节的输出是他后一个环节的输入，其单项相关性是显而易见的；3、时序性，由于流程对象中，各环节在得到前一环节的输出时，本环节的变化需要一定的时间，前一环节的状态变化将经过一段时间后才能导致下一状态的变化。那么，流程对象各环节的状态参数实际上是一个时间序列。

现有的数据处理技术大多采用随机抽样和人工干预的方式对原始数据进行预处理，受人为因素影响较多，且无法对数据间的时间序列进行调整，所以难以真正体现流程对象间的影响关系。因此需要一种面向流程对象的原始数据的时序发现与调整方法，提升知识发现能力。

发明内容

为了克服现有技术中存在的不足，本发明提供一种流程对象原始数据时序发现与调整方法，对原始数据进行抽样、发现时序并调整时序，具有简单、精确、人为干预少的优点，以解决现有流程工业中原始数据错漏较多，无法体现各个环节间的相互影响关系的问题。

为实现上述目的，本发明对流程对象进行了定义：流程对象是多个环节、具有向前相关性的时间序列集合，这个时间序列集合中的数据来自各个环节的可采样测点，在流程对象x中，某一测点X_i的变化导致另一测点X_j产生响应的时间差值为测点X_i对测点X_j的延迟时间为时间距，记为Δt_ij，Δt_ij＝t(X_j)-t(X_i)。本发明根据流程对像的特点提出了利用测点中数据的分布规律进行统计分类的方法实现数据抽样与时序发现的方案，并根据时序计算结果调整数据，使之符合周期规律，便于智能处理。

具体的，本发明采取如下技术方案：

一种流程对象原始数据时序发现与调整方法，包括如下步骤：

数据取样步骤，对流程对象各环节测点在时间T内采集到的原始数据集进行抽样，抽取单位时间段内变化量最大的数据片段作为样本数据；

时序发现步骤，以任意环节测点为基测点，计算其与其他环节测点间的时间距，从而获得包含所有环节测点时间顺序的时间序列L；

时序调整步骤，根据时间序列L对各环节测点原始数据进行时序调整。

更进一步的，由于原始数据记录数巨大，逐条记录遍历来统计连续记录数效率低下，耗费系统时间长，不符合大数据处理的要求，本发明采用了逐步缩小时间范围的算法来快速求得记录的最长连续时间段。另外，本发明选择流程对象中变化量最大的数据片段作为数据样本。数据的差分代表了数据的状态变化，而差分大小代表了数据变化的幅度，变化即是信息，变化幅度越大包含的信息越多，数据变化量即是环节数据差分绝对值的和，因此选择数据变化量最大的数据片段也即选择了包含信息量最大的数据片段。

因此，本发明数据取样步骤采用基于差分的数据取样方法进行抽样，将时间T划分为若干时间段，计算每个时间段内各个环节测点数据变化量，抽取各个环节测点数据变化量之和最大的时间段内采集的数据片段作为样本数据。

优选的，所述基于差分的数据取样方法包括如下步骤：

设流程对象x共含有n个环节，x＝{X₁，X₂...X_n}，其任意环节X_i在t_j时刻的测量数据为x_i(t_j)；若将时间T＝{t₁，t₂，…，t_m}均分成w片段，每段长度为h，则w×h＝m，设其中任意时间段1≤y≤w，所有环节测点在T_y上的数据变化量为Δx_y，则 $> Δ x_{y} = Σ_{i = 1}^{n} Σ_{j = t_{u_{y}}}^{t_{u_{y} + h - 1}} | Δ x_{i} (t_{j}) |,$ >

因此在时间T＝{t₁，t₂，…，t_m}内， $> \exists T_{M} ⋐ T, T_{M} = {t_{u_{M}}, t_{u_{M} + 1}, . . ., t_{u_{M} + h - 1}},$ >使得Δx_M＝max{Δx_y，1≤y≤w}成立，则Δx_M为流程对象x在时间T内数据变化量最大的时间段，选择原始数据集中T_M时间段内的数据片段作为样本数据。

更进一步的，由于流程工业中环节间的数据波动具有传递性，当某一环节的数据有较大波动时，会引起其他环节状态的波动。对于一个开环系统，在调整时序时，极值点数据具有很好的代表性，当某一环节测点X_i出现极值时，另一个在时序排于X_i之后的测点X_j也会产生极值，且该极值点之间的时间间隔就是两个测点在时序上的延迟时间。根据数据的差分选取所有测点的波动极值点数据，通过该数据计算各测点之间的延迟时间，进而求出时序。在流程对象中，相邻环节之间数据的传递可能是很快的，某一环节的各极值点之间的时间间隔通常情况下会比任意两环节之间的延迟时间大，因此X_i所有极值点时刻和X_j所有极值点时刻的时间差值绝对值的最小值即是X_i和X_j之间的延迟时间。因此，本发明时序发现步骤根据数据的差分选取所有环节测点的极值点数据，通过极值点数据计算各环节测点之间的延迟时间，并将所述延迟时间作为各环节测点之间的时间距，进而求出时间序列L。

优选的，设任意环节测点X_i∈x，且使得x_i(t_o)＞x_i(t_j)或x_i(t_o)＜x_i(t_j)，t_j∈[t_l，t_o)∪(t_o，t_m]，则x_i(t_o)为X_i在时间段[t_l ，t_p]内的极值点数据；其中x表示流程对象，流程对象x共含有n个环节，x＝{X₁，X₂，...X_n}，i∈[1，2…n]其任意环节X_i在t_j时刻的测量数据为x_i(t_j)；T_M表示包含变化量最大数据片段的单位时间段。

优选的，时间序列L的确定包含如下步骤：

(1)以任意环节测点X_i为基测点，其在位置s与测点X_j在不同位置的时间差值的最小值为测点X_i在位置s与测点X_j在位置r的时间差值Δt_ij(sr)，其中s＝1,2,…,q，q表示各环节测点的极值点数目，j∈[1，2…n]，则：

Δt_ij(sr)＝{t′_s(X_j)-t′_r(X_i)|min{|t′_s(X_j)-t′_r(X_i)|，r＝1，２，...，q}}；

(2)测点X_i与测点X_j之间的时间距Δt_ij为Δt_ij(sr)相同的数目最多的值，其中

Δt_ij＝{Δt_ij(sr)|max{count(Δt_ij(sr))}}，

由此得到测点X_i与流程对象所有测点之间的时间距，即相互间的影响周期；

(3)以测点X_i位置为基准，保持X_i不动，若Δt_ij＞0，将测点X_j置于X_i的前|Δt_ij|个采样时间间隔位置；若Δt_ij＜0，将测点X_j置于X_i的后|Δt_ij|个采样时间间隔位置；若Δt_ij＝0，X_j的位置和X_i处于同等位置，从而得到包含所有环节测点时间顺序的时间序列L，设为L＝{X′_1s，X′_2s，…，X′_ns}。

更进一步的，时序调整步骤中，根据时序发现步骤得到的所有环节测点间的时间序列L，以任意环节测点的原始数据为基准，保持基准测点的原始数据不动，然后根据其他环节测点与基准测点的时间距进行时序调整。

优选的，所述时序调整步骤中，根据时序发现步骤得到的所有环节测点间的时间序列L，以任意环节测点X_i的原始数据为基准，保持X_i的原始数据不动，然后令测点X_j在t时刻的原始数据为X_j(t)＝X_j(t-Δt′_ij)，

其中Δt′_ij为时间序列L中X′_i对X′_j的时间距，X′_i、X′_j分别表示时间序列L中按时间顺序排列后的测点X_i、X_j位置，Δt′_ij＝t(X′_j)-t(X′_i)，若Δt′_ij＞0，将测点X_j的原始数据向后移动|Δt′_ij|个采样时间间隔；若Δt′_ij＜0，将测点X_j的原始数据向前移动|Δt′_ij|个采样时间间隔；若Δt′_ij＝0，测点X_j的原始数据不变。经该时序调整得到的数据是在同一时刻在X′₁产生变化，在{X′₂，…，X′_n}处产生响应的数据，基于该数据进行信息计算后，完成了时间序列的正确性和统一性调整。

有益效果：(1)本发明是利用统计学理论结合大数据处理思想，对流程对象历史数据进行分析处理，完全体现了从数据中获取知识的特点，没有任何人工操作的干预，避免了人为因素的干扰。

(2)本发明以原始数据值的周期区间进行抽样计算，避免了少量异常数据对结果的干扰；并设计了时间距计算函数和时序调整办法，使得所有的样本数据具有时序的正确性以统一性。

(3)本发明中所有的方法都有严格的理论基础，并且没有涉及非常复杂的运算，保证了算法的准确性和高效性。

附图说明

图1为本发明数据抽样流程图。

图2为本发明时序运算流程图。

具体实施方式

下面结合附图对本发明作更进一步的说明。

如图1是数据抽样流程，算法的输入是流程工业对象采集到的原始数据集，经过抽样算法，得到的计算结果是去掉错漏数据和噪声后的典型样本数据。首先是计算任一环节X_i在t_j时刻的差分为Δx_i(t_j)：

Δx_i(t_j)＝x_i(t_j+1)-x_i(t_j) (1)

差分反应出各环节数据随时间的增减变化，根据公式1得到所有环节任意时刻的差分值，形成差分表1。

表1

然后对数据的时间进行分段，若将时间T＝{t₁，t₂，…，t_m}均分成w片段，每段长度为h，则w×h＝m，设其中任意一段时间为1≤y≤w，所有环节在T_y上的变化量为Δx_y

$> Δ x_{y} = Σ_{i = 1}^{n} Σ_{j = t_{u_{y}}}^{t_{u_{y} + h - 1}} | Δ x_{i} (t_{j}) | - - - (2)$ >

在时间T＝{t₁，t₂，…，t_m}内， $> \exists T_{M} ⋐ T, T_{M} = {t_{u_{M}}, t_{u_{M} + 1}, . . ., t_{u_{M} + h - 1}},$ >求得最大的Δx_M值

Δx_M＝max{Δx_y，1≤y≤w} (3)

即是流程对象x在时间T内含有信息量最大的时间段，选择T_M时间段内的数据作为样本数据。

图2是时序发现与调整流程，算法的输入内容是前一流程数据抽样得到的样本数据集，经过算法计算后得到的输出是统一时序后的标准数据集。算法的依据是：在流程工业中，某一测点的波动会引起其他测点相应的波动，极值点数据具有很好的代表性，某一测点一个极值点处的变化会引起其他测点的变化，同样也会导致一个极值的出现。

首先，求任意测点的极值：对任意测点X_i∈x，且使得x_i(t_o)＞x_i(t_j)或x_i(t_o)＜x_i(t_j)，t_j∈[t_l，t_o)∪(t_o，t_m]，即xi(t_o)为X_i在时间段[t_l，t_p]内的极值。

设样本数据中任意环节X_i含有q个极值，其中第j个极值为x_i(t′_j)，则流程对象x所有测点在q个极值点的数据如极值表2所示

表2

其中，记1,2,…,q为数据的位置，则各位置的数据应是各个测点有较大波动的极值点，记X_i的q个极值点时刻分别为{t′₁(X_i)，t′₂(X_i)...t′q(X_i)}。

得到测点的极值点出现时刻后，对于极值数据，以任意一个测点X_i为基测点，其在位置s(s＝1,2,…,q)与测点X_j的不同位置的时间差值的最小值为测点X_i在位置s与测点X_j(位置r)的时间差值Δt_ij(sr)，即

Δt_ij(sr)＝{t′_s(X_j)-t′_r(X_i)|min{|t′_s(X_j)-t′_r(X_i)|，r＝1，２，...，q}} (4)

测点X_i和对测点X_j的时间距是|Δt_ij(sr)相同的数目最多的值，即

Δt_ij＝{Δt_ij(sr)|max{count(Δt_ij(sr))}} (5)

由此可以得到测点X_i与所有测点之间的时间距，如表3所示：

表3

根据时间距可以得到时间序列L，以测点X_i位置为基准，保持X_i不动，若Δt_ij＞0，将测点X_j置于X_i的前|Δt_ij|个位置；若Δt_ij＜0，将测点X_j置于X_i的后|Δt_ij|个位置；若Δt_ij＝0，X_j的位置和X_i处于同等位置。此时，得到所有测点有时间顺序的时间序列L，设为

L＝{X′_1s，X′_2s，…，X′_ns} (6)

设X′_i对X′_j的时间距为Δt′_ij＝t(X′_j)-t(X′_i)，样，根据时间距可以对采样数据进行移位，以测点X_i的数据为基准，保持X_i的数据不动，令测点X_j在t时刻的数据为

X_j(t)＝X_j(t-Δt′_ij) (7)

即若Δt′_ij＞0，将测点X_j的数据向后移动|Δt′_ij|个采样时间间隔；若Δt′_ij＜0，将测点X_j的数据向前移动|Δt′_ij|个采样时间间隔；若Δt′_ij＝0，测点X_j的数据不变。经该时序调整得到的数据是在同一时刻在X′₁产生变化，在{X′₂，…，X′_n}处产生响应的数据，基于该数据进行信息计算后，完成了时间序列的正确性和统一性调整。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种流程对象原始数据时序发现与调整方法 [P] . 中国专利： CN104346169B . 2017.06.16
2. 一种流程对象原始数据时序发现与调整方法 [P] . 中国专利： CN104346169A . 2015-02-11
3. Methods of associating data content with objects of rights in a communication system and to provide conditional access system to implement a method, the receiving device of flow to obtain conditional access to a stream of encrypted data, computer program product, and D Starting out for the transmission generated by a method. [P] . BRPI0515038A . 2008-07-01

机译：在通信系统中将数据内容与权限对象相关联并提供条件访问系统以实施一种方法的方法，流程的接收设备以获得对加密数据流的条件访问，计算机程序产品和D传输产生的一种方法。
4. During the discovery of devices in a wireless network, a method and apparatus for dynamically adjusting the configuration parameters discovery protocol [P] . 日本专利： JP5999606B2 . 2016-09-28

机译：在无线网络中的设备发现期间，一种用于动态调整配置参数发现协议的方法和装置
5. During discovery of devices in a wireless network , a method and apparatus to dynamically adjust the configuration parameters of the discovery protocol [P] . 日本专利： JP2014519774A . 2014-08-14

机译：在无线网络中的设备发现期间，一种用于动态调整发现协议的配置参数的方法和装置