首页> 中国专利> 一种流程对象原始数据时序发现与调整方法

一种流程对象原始数据时序发现与调整方法

摘要

本发明公开了一种流程对象原始数据时序发现与调整方法,包括:数据取样步骤,对流程对象各环节测点在时间T内采集到的原始数据集进行抽样,抽取单位时间段内变化量最大的数据片段作为样本数据;时序发现步骤,以任意环节测点为基测点,计算其与其他环节测点间的时间距,从而获得包含所有环节测点时间顺序的时间序列L;时序调整步骤,根据时间序列L对各环节测点原始数据进行时序调整。本发明对原始数据进行抽样、发现时序并调整时序,具有简单、精确、人为干预少的优点,以解决现有流程工业中原始数据错漏较多,无法体现各个环节间的相互影响关系的问题。

著录项

  • 公开/公告号CN104346169A

    专利类型发明专利

  • 公开/公告日2015-02-11

    原文格式PDF

  • 申请/专利权人 济南大学;

    申请/专利号CN201410542448.6

  • 申请日2014-10-14

  • 分类号G06F9/44;

  • 代理机构济南舜源专利事务所有限公司;

  • 代理人赵佳民

  • 地址 250022 山东省济南市市中区南辛庄西路336号

  • 入库时间 2023-12-17 04:14:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-08

    未缴年费专利权终止 IPC(主分类):G06F9/44 授权公告日:20170616 终止日期:20181014 申请日:20141014

    专利权的终止

  • 2017-06-16

    授权

    授权

  • 2015-03-11

    实质审查的生效 IPC(主分类):G06F9/44 申请日:20141014

    实质审查的生效

  • 2015-02-11

    公开

    公开

说明书

技术领域

本发明涉及流程工业生产领域,尤其涉及流程工业中的一种流程对象原始数据时序发现与调整方法。 

背景技术

在流程工业生产中,生产过程根据工业要求由一个个环节构成的,各个环节具有传递性,每个环节通常需要加装许多检测装置,通过数据接口,将检测数据传入数据存储计算机中,数据量巨大,利用这些数据进行优化工业控制流程、辅助控制决策的需求不断增加;而且流程工业的数据采集是基于一定频率的,各个环节采集到的数据是相互联系的,并且是相互制约的,流程工业中的各个环节具有时序特征,但是由于状态传播的延迟,使采集到的数据不具有时序性,相同时刻的各环节数据不是该时刻对其他环节产生响应的数据,表现出了不同步的特性,直接用该数据进行后续运算不会反映出流程数据的时序性;时序运算,即找出流程对象各测点之间的时序,并求出时序流程不同测点之间的延迟时间,一直是研究热题;然而由于在流程工业生产过程中,常常因其煅烧过程和物料的复杂性,还存在着一些复杂而且目前还不可检测的环境因素,工作环境的限制与信息采集技术的不完善,导致获得的原始数据间时序特征不明显且存在大量的噪声与错漏数据,导致从原始数据中获取知识非常困难,因此迫切需要对原始数据进行规范化处理。 

流程对象通常具有以下特性:1、多环节性,一个流程对象,通常由诸多环节构成,每个环节根据工艺要求前后相连,前一环节的输出是它下一环节的输入;2、单向向前相关性,我们可以将一个流程看作一个开环系统(通常在工业过程中,局部的闭环控制可以视为一个环节),对于一个开环系统,每个环节的输出是他后一个环节的输入,其单项相关性是显而易见的;3、时序性,由于流程对象中,各环节在得到前一环节的输出时,本环节的变化需要一定的时间,前一环节的状态变化将经过一段时间后才能导致下一状态的变化。那么,流程对象各环节的状态参数实际上是一个时间序列。 

现有的数据处理技术大多采用随机抽样和人工干预的方式对原始数据进行预处理,受人为因素影响较多,且无法对数据间的时间序列进行调整,所以难以真正体现流程对象间的影响关系。因此需要一种面向流程对象的原始数据的时序发现与调整方法,提升知识发现能力。 

发明内容

为了克服现有技术中存在的不足,本发明提供一种流程对象原始数据时序发现与调 整方法,对原始数据进行抽样、发现时序并调整时序,具有简单、精确、人为干预少的优点,以解决现有流程工业中原始数据错漏较多,无法体现各个环节间的相互影响关系的问题。 

为实现上述目的,本发明对流程对象进行了定义:流程对象是多个环节、具有向前相关性的时间序列集合,这个时间序列集合中的数据来自各个环节的可采样测点,在流程对象x中,某一测点Xi的变化导致另一测点Xj产生响应的时间差值为测点Xi对测点Xj的延迟时间为时间距,记为Δtij,Δtij=t(Xj)-t(Xi)。本发明根据流程对像的特点提出了利用测点中数据的分布规律进行统计分类的方法实现数据抽样与时序发现的方案,并根据时序计算结果调整数据,使之符合周期规律,便于智能处理。 

具体的,本发明采取如下技术方案: 

一种流程对象原始数据时序发现与调整方法,包括如下步骤: 

数据取样步骤,对流程对象各环节测点在时间T内采集到的原始数据集进行抽样,抽取单位时间段内变化量最大的数据片段作为样本数据; 

时序发现步骤,以任意环节测点为基测点,计算其与其他环节测点间的时间距,从而获得包含所有环节测点时间顺序的时间序列L; 

时序调整步骤,根据时间序列L对各环节测点原始数据进行时序调整。 

更进一步的,由于原始数据记录数巨大,逐条记录遍历来统计连续记录数效率低下,耗费系统时间长,不符合大数据处理的要求,本发明采用了逐步缩小时间范围的算法来快速求得记录的最长连续时间段。另外,本发明选择流程对象中变化量最大的数据片段作为数据样本。数据的差分代表了数据的状态变化,而差分大小代表了数据变化的幅度,变化即是信息,变化幅度越大包含的信息越多,数据变化量即是环节数据差分绝对值的和,因此选择数据变化量最大的数据片段也即选择了包含信息量最大的数据片段。 

因此,本发明数据取样步骤采用基于差分的数据取样方法进行抽样,将时间T划分为若干时间段,计算每个时间段内各个环节测点数据变化量,抽取各个环节测点数据变化量之和最大的时间段内采集的数据片段作为样本数据。 

优选的,所述基于差分的数据取样方法包括如下步骤: 

设流程对象x共含有n个环节,x={X1,X2...Xn},其任意环节Xi在tj时刻的测量数据为xi(tj);若将时间T={t1,t2,…,tm}均分成w片段,每段长度为h,则w×h=m,设其中任意时间段1≤y≤w,所有环节测点在Ty上的数据变化量为Δxy,则>Δxy=Σi=1nΣj=tuytuy+h-1|Δxi(tj)|,>

因此在时间T={t1,t2,…,tm}内,>TMT,TM={tuM,tuM+1,...,tuM+h-1},>使得ΔxM=max{Δxy,1≤y≤w}成立,则ΔxM为流程对象x在时间T内数据变化量最大的时 间段,选择原始数据集中TM时间段内的数据片段作为样本数据。 

更进一步的,由于流程工业中环节间的数据波动具有传递性,当某一环节的数据有较大波动时,会引起其他环节状态的波动。对于一个开环系统,在调整时序时,极值点数据具有很好的代表性,当某一环节测点Xi出现极值时,另一个在时序排于Xi之后的测点Xj也会产生极值,且该极值点之间的时间间隔就是两个测点在时序上的延迟时间。根据数据的差分选取所有测点的波动极值点数据,通过该数据计算各测点之间的延迟时间,进而求出时序。在流程对象中,相邻环节之间数据的传递可能是很快的,某一环节的各极值点之间的时间间隔通常情况下会比任意两环节之间的延迟时间大,因此Xi所有极值点时刻和Xj所有极值点时刻的时间差值绝对值的最小值即是Xi和Xj之间的延迟时间。因此,本发明时序发现步骤根据数据的差分选取所有环节测点的极值点数据,通过极值点数据计算各环节测点之间的延迟时间,并将所述延迟时间作为各环节测点之间的时间距,进而求出时间序列L。 

优选的,设任意环节测点Xi∈x,使得xi(to)>xi(tj)或xi(to)<xi(tj),tj∈[tl,to)∪(to,tm],则xi(to)为Xi在时间段[tl ,tp]内的极值点数据;其中x表示流程对象,流程对象x共含有n个环节,x={X1,X2,...Xn},i∈[1,2…n]其任意环节Xi在tj时刻的测量数据为xi(tj);TM表示包含变化量最大数据片段的单位时间段。 

优选的,时间序列L的确定包含如下步骤: 

(1)以任意环节测点Xi为基测点,其在位置s与测点Xj在不同位置的时间差值的最小值为测点Xi在位置s与测点Xj在位置r的时间差值Δtij(sr),其中s=1,2,…,q,q表示各环节测点的极值点数目,j∈[1,2…n],则: 

Δtij(sr)={t′s(Xj)-t′r(Xi)|min{|t′s(Xj)-t′r(Xi)|,r=1,2,...,q}}; 

(2)测点Xi与测点Xj之间的时间距Δtij为Δtij(sr)相同的数目最多的值,其中 

Δtij={Δtij(sr)|max{count(Δtij(sr))}}, 

由此得到测点Xi与流程对象所有测点之间的时间距,即相互间的影响周期; 

(3)以测点Xi位置为基准,保持Xi不动,若Δtij>0,将测点Xj置于Xi的前|Δtij|个采样时间间隔位置;若Δtij<0,将测点Xj置于Xi的后|Δtij|个采样时间间隔位置;若Δtij=0,Xj的位置和Xi处于同等位置,从而得到包含所有环节测点时间顺序的时间序列L,设为L={X′1s,X′2s,…,X′ns}。 

更进一步的,时序调整步骤中,根据时序发现步骤得到的所有环节测点间的时间序列L,以任意环节测点的原始数据为基准,保持基准测点的原始数据不动,然后根据其他环节测点与基准测点的时间距进行时序调整。 

优选的,所述时序调整步骤中,根据时序发现步骤得到的所有环节测点间的时间序列L,以任意环节测点Xi的原始数据为基准,保持Xi的原始数据不动,然后令测点Xj在t时刻的原始数据为Xj(t)=Xj(t-Δt′ij), 

其中Δt′ij为时间序列L中X′i对X′j的时间距,X′i、X′j分别表示时间序列L中按时间顺序排列后的测点Xi、Xj位置,Δt′ij=t(X′j)-t(X′i),若Δt′ij>0,将测点Xj的原始数据向后移动|Δt′ij|个采样时间间隔;若Δt′ij<0,将测点Xj的原始数据向前移动|Δt′ij|个采样时间间隔;若Δt′ij=0,测点Xj的原始数据不变。经该时序调整得到的数据是在同一时刻在X′1产生变化,在{X′2,…,X′n}处产生响应的数据,基于该数据进行信息计算后,完成了时间序列的正确性和统一性调整。 

有益效果:(1)本发明是利用统计学理论结合大数据处理思想,对流程对象历史数据进行分析处理,完全体现了从数据中获取知识的特点,没有任何人工操作的干预,避免了人为因素的干扰。 

(2)本发明以原始数据值的周期区间进行抽样计算,避免了少量异常数据对结果的干扰;并设计了时间距计算函数和时序调整办法,使得所有的样本数据具有时序的正确性以统一性。 

(3)本发明中所有的方法都有严格的理论基础,并且没有涉及非常复杂的运算,保证了算法的准确性和高效性。 

附图说明

图1为本发明数据抽样流程图。 

图2为本发明时序运算流程图。 

具体实施方式

下面结合附图对本发明作更进一步的说明。 

如图1是数据抽样流程,算法的输入是流程工业对象采集到的原始数据集,经过抽样算法,得到的计算结果是去掉错漏数据和噪声后的典型样本数据。首先是计算任一环节Xi在tj时刻的差分为Δxi(tj): 

Δxi(tj)=xi(tj+1)-xi(tj)    (1) 

差分反应出各环节数据随时间的增减变化,根据公式1得到所有环节任意时刻的差分值,形成差分表1。 

表1 

然后对数据的时间进行分段,若将时间T={t1,t2,…,tm}均分成w片段,每段长度为h,则w×h=m,设其中任意一段时间为1≤y≤w,所有环节在Ty上的变化量为Δxy

>Δxy=Σi=1nΣj=tuytuy+h-1|Δxi(tj)|---(2)>

在时间T={t1,t2,…,tm}内,>TMT,TM={tuM,tuM+1,...,tuM+h-1},>求得最大的ΔxM值 

ΔxM=max{Δxy,1≤y≤w}    (3) 

即是流程对象x在时间T内含有信息量最大的时间段,选择TM时间段内的数据作为样本数据。 

图2是时序发现与调整流程,算法的输入内容是前一流程数据抽样得到的样本数据集,经过算法计算后得到的输出是统一时序后的标准数据集。算法的依据是:在流程工业中,某一测点的波动会引起其他测点相应的波动,极值点数据具有很好的代表性,某一测点一个极值点处的变化会引起其他测点的变化,同样也会导致一个极值的出现。 

首先,求任意测点的极值:对任意测点Xi∈x,使得xi(to)>xi(tj)或xi(to)<xi(tj),tj∈[tl,to)∪(to,tm],即xi(to)为Xi在时间段[t,tp]内的极值。 

设样本数据中任意环节Xi含有q个极值,其中第j个极值为xi(t′j),则流程对象x所有测点在q个极值点的数据如极值表2所示 

表2 

其中,记1,2,…,q为数据的位置,则各位置的数据应是各个测点有较大波动的极值点,记Xi的q个极值点时刻分别为{t′1(Xi),t′2(Xi)...t′q(Xi)}。 

得到测点的极值点出现时刻后,对于极值数据,以任意一个测点Xi为基测点,其在位置s(s=1,2,…,q)与测点Xj的不同位置的时间差值的最小值为测点Xi在位置s与测点Xj(位置r)的时间差值Δtij(sr),即 

Δtij(sr)={t′s(Xj)-t′r(Xi)|min{|t′s(Xj)-t′r(Xi)|,r=1,2,...,q}}    (4) 

测点Xi和对测点Xj的时间距是|Δtij(sr)相同的数目最多的值,即 

Δtij={Δtij(sr)|max{count(Δtij(sr))}}    (5) 

由此可以得到测点Xi与所有测点之间的时间距,如表3所示: 

表3 

根据时间距可以得到时间序列L,以测点Xi位置为基准,保持Xi不动,若Δtij>0,将测点Xj置于Xi的前|Δtij|个位置;若Δtij<0,将测点Xj置于Xi的后|Δtij|个位置;若Δtij=0,Xj的位置和Xi处于同等位置。此时,得到所有测点有时间顺序的时间序列L,设为 

L={X′1s,X′2s,…,X′ns}    (6) 

设X′i对X′j的时间距为Δt′ij=t(X′j)-t(X′i),样,根据时间距可以对采样数据进行移位,以测点Xi的数据为基准,保持Xi的数据不动,令测点Xj在t时刻的数据为 

Xj(t)=Xj(t-Δt′ij)    (7) 

即若Δt′ij>0,将测点Xj的数据向后移动|Δt′ij|个采样时间间隔;若Δt′ij<0,将测点Xj的数据向前移动|Δt′ij|个采样时间间隔;若Δt′ij=0,测点Xj的数据不变。经该时序调 整得到的数据是在同一时刻在X′1产生变化,在{X′2,…,X′n}处产生响应的数据,基于该数据进行信息计算后,完成了时间序列的正确性和统一性调整。 

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号