首页> 中国专利> 一种智能环境下基于边缘设备规则推理的数据预部署方法

一种智能环境下基于边缘设备规则推理的数据预部署方法

摘要

本发明公开了一种智能环境下基于边缘设备规则推理的数据预部署方法,包括以下步骤:S1:提取规则中的特征计算作为统计单元,建立规则网络;S2:对规则进行解析和预处理;S3:根据统计单元建立轻量级特征表,提前对特征值进行计算和存储;S4:建立规则网络与特征表的直接引用关系,并实时监测轻量级特征表的内存使用量,设计LCT预部署;S1具体包括以下步骤:S101:获取时间序列数据流;S102:通过获取的数据流,进行规则推理。根据统计单元建立的轻量级特征表提前对特征值进行了计算和存储,通过让规则网络直接引用轻量级特征表中的特征值,避免了规则匹配期间对绝大多数原始数据的实时特征计算。

著录项

  • 公开/公告号CN112651506A

    专利类型发明专利

  • 公开/公告日2021-04-13

    原文格式PDF

  • 申请/专利权人 重庆大学;

    申请/专利号CN202011545218.7

  • 发明设计人 汪成亮;赵凯;

    申请日2020-12-24

  • 分类号G06N5/04(20060101);G06N5/02(20060101);G06F16/22(20190101);G06F16/2458(20190101);

  • 代理机构50230 重庆市信立达专利代理事务所(普通合伙);

  • 代理人陈炳萍

  • 地址 400044 重庆市沙坪坝区正街174号

  • 入库时间 2023-06-19 10:35:20

说明书

技术领域

本发明涉及智能设备数据预处理技术领域,更具体地说,它涉及一种智能环境下基于边缘设备规则推理的数据预部署方法。

背景技术

近年来,随着无线传感器网络(WSN)的发展,智能环境系统已得到广泛研究。智能环境是一个部署了大量边缘设备的可交互式空间,其目的是根据边缘设备中传感器采集的环境信息来进行活动识别、睡眠监测等活动,智能环境系统与边缘设备的关系如图1所示,智能环境中部署了许多边缘设备,每个边缘设备都部署了独立的数据采集模块和规则推理模块,嵌入在边缘设备上的传感器采集环境信息并周期性地传输给规则推理模块用于规则推理,规则推理模块中,规则库中存储的规则一般由相关领域的专家知识转化而来,其结构类似于”IF-THEN”,其中IF后接条件(规则前件),THEN后接响应(规则后件),工作内存是一个包含数据元素的全局数据库,由部署在智能环境中的传感器以特定频率直接采集得到的原始数据和推理过程中产生的临时数据一般都包含在工作内存中,工作内存中的所有数据都可以被规则条件引用,运行时系统根据当前工作内存中的数据与规则库中的规则进行匹配,匹配期间计算引擎完成规则前件中包含特征计算、比较运算和逻辑运算在内的推理计算,若推理计算结果为true,则规则被激活,被激活的规则触发相应的响应,同时可能产生临时数据参与后续的规则推理,然而,现有的规则推理模块最大的缺点在于匹配效率低下,系统90%以上的时间被用在匹配过程中,无法满足智能环境系统的实时性需求,在智能环境系统中,匹配效率低下的原因主要包括以下两个方面:

①规则重复匹配,在智能环境系统的大多数应用中,规则集中的规则之间很有可能在规则前件或更细粒度的计算单元上存在交叉重叠的部分,然而,随着智能环境系统的发展,规则集的规模得到迅速增长,如果将工作内存中的数据与每个规则逐个进行匹配,则无法避免对这些重叠部分的重复匹配,匹配的时间复杂度会随着规则和数据规模的增长呈指数增长,

②推理计算量过大,随着无线传感器网络的发展,智能环境系统中产生的数据越来越多,规则匹配期间对原始数据的特征计算量随着数据量和规则数量的增加而成倍增加,现有推理系统在规则匹配期间对原始数据进行的大量实时特征计算使得匹配效率大大降低,

对于规则的重复匹配,Forgy在1979年提出的RETE算法较好的解决了这一问题,RETE算法是一种增量匹配的推理算法,它通过建立规则网络实现了规则间的模式共享来加速规则的匹配,目前,已有许多基于RETE算法的推理系统(如CLIP,JESS,DROOLS,BizTalk)被投入商业使用,然而,这些系统通常过于笨重和复杂,更重要的是,RETE算法缺少对推理计算量过大问题的解决方案,因此不能直接应用于智能环境下的推理系统,另外,在规则匹配完成前,大量用于推理计算的原始数据需要被缓存在内存中,边缘设备受限的内存资源与巨大的内存需求间的矛盾成为推理实时性的重大瓶颈,

发明内容

为解决上述技术问题,本发明提供一种智能环境下基于边缘设备规则推理的数据预部署方法,通过对规则进行预分析和预处理,首先建立了规则网络避免了对规则的重复匹配,同时提取规则前件中的特征计算作为统计单元,然后,根据统计单元建立的轻量级特征表(Light-Weight Characteristic Table,LCT)提前对特征值进行了计算和存储,通过让规则网络直接引用轻量级特征表中的特征值,避免了规则匹配期间对绝大多数原始数据的实时特征计算,最后,基于系统对轻量级特征表的内存使用量具有一定的静态可预测性的特性,设计了LCT预部署策略以应对系统内存受限的情况。

本发明通过以下技术方案得以实现的:

一种智能环境下基于边缘设备规则推理的数据预部署方法,包括以下步骤:

S1:提取规则中的特征计算作为统计单元,建立规则网络;

S2:对规则进行解析和预处理;

S3:根据统计单元建立轻量级特征表,提前对特征值进行计算和存储;

S4:建立规则网络与特征表的直接引用关系,并实时监测轻量级特征表的内存使用量,设计LCT预部署;

S1具体包括以下步骤:

S101:获取时间序列数据流;

S102:通过获取的数据流,进行规则推理。

作为一种优选方案,S101具体包括以下步骤:在智能环境系统中,将输入的数据视为按照时间递增顺序排列的三元组序列(streamID,timestamp,value),一个数据流由具有相同streamID的三元组组成;令按照时间递增顺序排列的无穷时间序列S=

作为一种优选方案,S102具体包括以下步骤:令条件仅有逻辑与(∧)参与连接的规则为原子规则;

其中:规则中不可被逻辑运算符继续分割的最小条件为原子条件;由一个或多个原子条件,和零个或多个组合条件通过逻辑运算符连接而成的条件为组合条件,通过原子条件组合成为组合条件,构建规则网络。

作为一种优选方案,S2具体包括以下步骤:令RS[i]表示由所有推理周期都是period

作为一种优选方案,S3具体包括以下步骤:令stat

btn=GCD(period,T

轻量级特征表由滑动窗口大小为TS∪ND∪btu中各元素分组的列组成,其中按窗口大小为btu分组的列直接计算原始数据的特征值,存储基本窗口的摘要;按窗口大小为ND各元素大小分组的列通过汇总基本窗口的摘要得到用于增量式计算的中间摘要;按窗口大小为TSA[i]分组的列通过汇总窗口大小分别为TSA[i-1]与ND[i]分组的列的摘要得到可增量式计算的特征值;按窗口大小为TSB各元素大小分组的列采用直接计算原始数据的方式得到不可增量式计算的特征值,轻量级特征表仅缓存不可增量式计算特征计算所需的原始数据,而对于基本窗口,则仅保留摘要,不保留原始数据。

综上所述,本发明具有以下有益效果:

本发明设计了规则解析与预处理模块,该模块通过解析规则集构建了规则网络并提取得到统计单元,然后,本发明利用得到的统计单元构建了一种在线数据结构轻量级特征表,它采用增量式的方式计算特征并保存特征值,通过使规则网络直接引用轻量级特征表中保存的特征值并进行网络筛选和网络传播完成推理工作,从而避免了规则匹配期间绝大多数实时特征计算,最后,基于系统的内存占用量具有一定的静态可预测性的特性设计的LCT预部署方案解决了系统内存受限的问题,一系列实验结果表明,即使在数据量、规则集、最大窗口大小很大的情况下,该方案仍能显著提高推理系统的性能。

附图说明

图1是本发明背景技术中的智能环境系统与边缘设备结构示意图;

图2是本发明实施例中的DPDS架构图;

图3是本发明实施例中的规则网络转化图;

图4是本发明实施例中滑动窗口与基本窗口的结构示意图;

图5是本发明实施例中LCT的结构示意图;

图6是本发明实施例中LCT部署示意图。

具体实施方式

本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包括”为一开放式用语,故应解释成“包括但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。

本说明书及权利要求的上下左右等方位名词,是结合附图以便于进一步说明,使得本申请更加方便理解,并不对本申请做出限定,在不同的场景中,上下、左右、里外均是相对而言。

以下结合附图对本发明作进一步详细说明。

DPDS的架构如图2所示,根据规则集中规则的推理周期可以将规则集划分为具有不同推理周期的规则子集,利用规则解析与预处理模块,分别为这些规则子集构造了规则网络和轻量级特征表,通过让规则网络直接引用轻量级特征表中的特征值并完成规则网络的筛选与传播,与特征值匹配的组合条件触发相应的响应,推理工作得以完成。

在一个智能环境系统中,智能性的实现依赖于各边缘设备将从传感器采集的时间序列数据流输入到规则推理模块中进行规则推理的过程,规则推理包含:对时间界限内的原始数据做特征计算,将特征值与阈值进行比较,用逻辑运算符连接比较结果等一系列计算过程,其中比较运算与逻辑运算相较于特征计算在计算代价上是廉价的,为了避免在大量规则进行规则匹配期间对原始数据做实时特征计算导致的时延,本发明首先设计了规则解析与预处理模块,通过使用该模块解析规则集,本发明构建了规则网络并得到了对应于规则网络中每个原子条件的统计单元,利用统计单元,本发明设计了一种线上数据结构轻量级特征表(Light-Weight characteristic Table,LCT)用于计算与存储原子条件引用的特征值,另外,基于DPDS中系统对LCT的内存使用量具有一定静态可预测性的特性,本发明提出了一种LCT预部署方案,该方案通过为轻量级特征表赋予优先级并在内存预算不足时离线优先级较低的轻量级特征表,解决了系统内存受限的问题。

时间序列数据流

在智能环境系统中,将输入的数据视为按照时间递增顺序排列的三元组序列(streamID,timestamp,value),一个数据流由具有相同streamID的三元组组成,例如,在睡眠监测应用中,streamID可以表示震动。

定义1(数据流)一个数据流是按照时间递增顺序排列的无穷时间序列S=

数据流以特定时间间隔(例如,一秒钟)周期性地增加新的元组,称这个特定时间间隔为该数据流的增长周期,称增长周期的倒数为该数据流的流速,例如,若数据流S的增长周期为1秒钟(流速为1个/秒),且当前时刻为t,则该数据流在1秒钟后增加一个时间戳为t+1的新元素S[t+1],若在增长周期到来时没有新的元组,则采用插值法填充,若在增长周期期间有多个新的元组,则以多个元组的汇总结果代替,在本发明中,S[t]表示在时刻t数据流S的值,S

规则推理

在智能环境系统中,规则反映了人类求解问题的行为特征,是一种知识的表示方法,规则包含属性(RID,period),其中RID为规则的ID,period为规则的推理周期,不同的规则可能具有不同的推理周期,规则的结构可以被表示为诸如C

定义2(原子规则)将条件仅有逻辑与(∧)参与连接的规则称为原子规则。

每条原子规则可以被抽象为一个树结构,其中响应表示根节点而原子条件表示叶子结点,通过将被多个具有相同推理周期的规则形成的树共享的原子条件组合成为组合条件,可以构建规则网络,每个规则网络由具有相同推理周期的规则组成的规则子集构建,该推理周期也是规则子集的推理周期,由规则C

时间谓词:时间界限(如滑动窗口)等,

数据谓词:比较运算符,如<,>,≤,≥,=等;统计运算符,如MAX,MIN,AVG,SD(standard deviation),VAR(variance)等,逻辑运算符:逻辑与(∧),逻辑或(∨),逻辑非~)。

定义3(原子条件)将规则中不可被逻辑运算符继续分割的最小条件称为原子条件。

定义4(组合条件)将由一个或多个原子条件,和零个或多个组合条件通过逻辑运算符连接而成的条件称为组合条件。

在现有推理系统中,推理过程是将数据流作为规则网络的输入,然后将原始数据进行网络筛选并传播,最终与原始条件匹配的组合条件触发相应响应的过程,在规则网络中,每个原子条件包含行为特征相关的计算操作,这些行为特征大多可以被总结为各种统计特征,给定时间长度T和当前时刻t,则stat(S

定义5(滑动窗口)设T是一个时间长度,t>T是一个变化的时刻,则称SW[t-T:t]为S的一个时间间隔为T的滑动窗口,其中t和T的单位相同,并且t为相对于S的起始观测时刻的时间距离。

在现有推理系统中,推理过程是将数据流作为规则网络的输入,然后将原始数据进行网络筛选并传播,最终与原始条件匹配的组合条件触发相应响应的过程,在规则网络中,每个原子条件包含行为特征相关的计算操作,这些行为特征大多可以被总结为各种统计特征,给定时间长度T和当前时刻t,则stat(S

定义5(滑动窗口)设T是一个时间长度,t>T是一个变化的时刻,则称SW[t-T:t]为S的一个时间间隔为T的滑动窗口,其中t和T的单位相同,并且t为相对于S的起始观测时刻的时间距离。

在现有推理系统中,推理过程是将数据流作为规则网络的输入,然后将原始数据进行网络筛选并传播,最终与原始条件匹配的组合条件触发相应响应的过程,在规则网络中,每个原子条件包含行为特征相关的计算操作,这些行为特征大多可以被总结为各种统计特征,给定时间长度T和当前时刻t,则stat(S

定义5(滑动窗口)设T是一个时间长度,t>T是一个变化的时刻,则称SW[t-T:t]为S的一个时间间隔为T的滑动窗口,其中t和T的单位相同,并且t为相对于S的起始观测时刻的时间距离。

规则解析与预处理

令RS[i]表示由所有推理周期都是period

其中,CID代表该统计单元对应的原子条件的索引号,stat代表统计运算符,包含属性(isInc,ref),isInc代表是否可增量式计算,ref代表可引用的特征,wSize代表特征计算操作的滑动窗口的大小,streamID代表特征计算操作的数据流ID,period代表该特征计算的计算周期,value代表特征值,将特征值初始化为0,可增量式计算表示:给定一组历史样本值h

表1

假设规则解析与预处理模块解析一个规则子集得到的统计单元序列对应的特征计算为stat

轻量级特征表(Light-Weight Characteristic Table,LCT)

在DPDS中,规则网络需要具有对输入数据流在滑动窗口上的特征值进行筛选的能力,因此系统有必要维护这些特征值在某历史时刻的状态,在本发明中,该功能是由轻量级特征表(LCT)提供的,轻量级特征表将对应于原子条件的统计单元的特征值计算并存储于内存中,一个轻量级特征表对应一个规则网络,它是通过一组由相同滑动窗口大小分组的列定义的,为叙述方便,后文仅讨论规则子集和数据流数目为1的情况。

令stat

令最大滑动窗口中的数据流子序列为S[t-w:t],假设w=kb,其中k表示最大滑动窗口中基本窗口的数目而b表示基本窗口的长度,令BW,BW,…,BW[k-1]表示最大滑动窗口SW中的基本窗口序列,其中BW[i]=S[t-w+ib:t-w+(i+1)b],随着滑动窗口向前滑动,当新的基本窗口BW[k]生成时,基本窗口BW过期,基本窗口的长度设定非常重要,因为在基本窗口BW[i+1]生成之前,必须获取BW[i]中的数据摘要,基本窗口BW[i]中第j个元素表示为BW[i;j],本发明取规则子集的推理周期和所有滑动窗口大小的最大公约数作为基本窗口的长度,称基本窗口的长度为基本时间单元(basic time unit),用btn表示。

btn=GCD(period,T

为了得到滑动窗口中的可增量式计算的特征值,首先需要维护基本窗口的摘要,以计算滑动窗口的平均值为例,对于基本窗口BW[i],需要维护的摘要为

轻量级特征表由滑动窗口大小为TS∪ND∪btu中各元素分组的列组成,其中按窗口大小为btu分组的列直接计算原始数据的特征值,存储基本窗口的摘要;按窗口大小为ND各元素大小分组的列通过汇总基本窗口的摘要得到用于增量式计算的中间摘要;按窗口大小为TSA[i]分组的列通过汇总窗口大小分别为TSA[i-1]与ND[i]分组的列的摘要得到可增量式计算的特征值;按窗口大小为TSB各元素大小分组的列采用直接计算原始数据的方式得到不可增量式计算的特征值,轻量级特征表仅缓存不可增量式计算特征计算所需的原始数据,而对于基本窗口,则仅保留摘要,不保留原始数据。

目标列存储了原子条件引用的特征值,为了阐述轻量级特征表,图5展示了一个老年人睡眠监测应用中根据一个简单规则子集构造的轻量级特征表,该规则子集的推理周期为5分钟,该应用中,在床上安装地震检波器用于监测睡眠期间的身体运动和姿势,简单的规则子集如下所示:

R1:IF AVG(S1,4MIN)<=0.632AND VAR(S1,11MIN)<=0.221THEN A1=1

R2:IF MAX(S1,7MIN)>1.112AND AVG(S1,9MIN)>0.436AND KU RTOSIS(S1,9)>0THEN A2=1

该规则子集对应的TSA={4MIN,7MIN,9MIN,11MIN},ND={4MIN,3MIN,2MIN,2MIN},TSB={11MIN},SS={MAX,AVG,VAR},btu=1MIN,

图5所示的轻量级特征表中,保存了距离当前时刻到最大滑动窗口大小为止的所有历史时刻的基本窗口摘要,通过汇总基本窗口摘要得到了由滑动窗口大小为ND各元素分组的列的摘要,进而通过增量式计算逐步得到了各统计单元的特征值,

LCT预部署策略

对于存储特征值的轻量级特征表,应尽可能存放在内存中以减少系统I/O,然而,在智能环境系统中,边缘设备的可用资源有限,对于具有大规模规则的智能环境系统来说,特征量随着规则规模的成倍增加将导致轻量级特征表的数量和内存占用量大大增加,进而将增加内存和磁盘之间的数据交换次数,因此需要恰当的安排数据交换的时机和策略以适应智能环境系统中内存受限的情况,在智能环境系统中,系统的内存占用主要由规则网络,轻量级特征表和缓存的原始数据组成,基于系统的内存占用量具有一定的静态可预测性的特性,即在规则集确定后,对轻量级特征表的数量和内存占用量都是可知的这一特性,设计了一种基于规则集预分析和预处理的LCT预部署策略。

假设一个规则子集由统计单元中滑动窗口大小组成的集合为TS,TSA,TSB分别代表由运算符为可增量式计算和不可增量式计算的统计单元的滑动窗口大小组成的集合,

对于离线轻量级特征表,在内存中为其保存TSA,TSB,SS等信息,并在每个基本窗口创建完成时将基本窗口容纳的原始数据和摘要写入磁盘,每个基本窗口都有其索引信息:

在离线轻量级特征表对应的规则网络的推理时刻到来前,预取t-TSA(α)至t之间所有的基本窗口摘要和t-TSB(β)至t之间所有的原始数据,并在缓存块中提前构造离线轻量级特征表。

同样以前文老年人睡眠监测应用中的规则子集为例,图6阐述了离线轻量级特征表的构造过程。

本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号