首页> 中国专利> 基于分簇DGM的无线传感器网络数据融合方法

基于分簇DGM的无线传感器网络数据融合方法

摘要

本方法涉及高性能计算技术领域,特别涉及基于分簇DGM的无线传感器网络数据融合方法;方法包括按照空间相关性对多传感器数据进行动态分簇;对数据序列群中的异常点检测和补齐;借助灰理论中的离散区间灰数概念对传感器节点之间的相关性进行描述;采用离散灰数DGM预测模型对数据序列的发展趋势进行建模预测;实现多传感器数据融合;本方法能有效地对异常点进行检测和补齐,提升数据的可靠性;利用数据之间的空间关联性进行预测数据的修正,有效地提升数据预测的准确性;减少了簇头节点和汇聚节点之间的数据发送量;有效减少传感器节点的传输距离;降低传感器节点的传输能耗;减少了汇聚节点的对接点数,缓解了网络拥塞问题。

著录项

  • 公开/公告号CN108337685A

    专利类型发明专利

  • 公开/公告日2018-07-27

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN201810076862.0

  • 发明设计人 代劲;赵显静;郭亮;尹航;

    申请日2018-01-26

  • 分类号

  • 代理机构重庆辉腾律师事务所;

  • 代理人王海军

  • 地址 400065 重庆市南岸区南山街道崇文路2号

  • 入库时间 2023-06-19 06:30:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-24

    授权

    授权

  • 2018-08-21

    实质审查的生效 IPC(主分类):H04W16/22 申请日:20180126

    实质审查的生效

  • 2018-07-27

    公开

    公开

说明书

技术领域

本发明涉及高性能计算技术领域,特别涉及基于分簇离散灰色模型(Discrete grey model,DGM)的无线传感器网络数据融合方法。

背景技术

无线传感器网络(Wireless Sensor Networks,WSNs)是由部署在监测区域内大量传感器节点相互通信形成的自组织网络系统能够实时监测、感知和采集网络分布区域内的各种监测对象信息,广泛应用到军事侦察、生物医学、智能交通、资源探测等领域。

数据冗余与受限的传感器数据采集传输是WSNs应用中的瓶颈问题,主要源自于WSNs自身的结构特点:(1)传感器节点部署密集,数据受时间变化影响大,存在较大冗余及不稳定性;(2)传感器节点普遍存在较多制约条件(如电池容量、计算能力、存储空间和通讯带宽等),有限的网络资源无法处理大规模数据,导致传输拥塞甚至网络崩溃。多传感器数据融合(Data fusion)(参见文献康健,左宪章,唐力伟,等.无线传感器网络数据融合技术[J].计算机科学,2010,37(4):31-35.)是解决数据冗余、减少网络消耗的有效方法,在信息不丢失的前提下,采用一定的技术来减少数据量,最终减少存储空间,提高数据存储、传输与处理效率。

基于时序数据分析及预测的传感器数据融合方法是近年来的研究热点,其主要依据如下:(1)在WSNs网络中,数据呈典型的序列分布,具有显著的时域特征;(2)同一时刻前后的数据具有一定程度的相关性,通过分析时间序列相关信息可以更加准确的认知监测对象内在特征和变化规律。目前基于时序数据分析及预测的传感器数据融合方法主要分为以下三种:

(1)基于单一预测模型的预测方法;Chu,D(参见文献Chu,D.;Deshpande,A.;Hellerstein,J.M.;Hong,W.Approximate data collection in sensor networks using probabilistic models.In Proceedings of the 22nd International Conference on Data Engineering,Atlanta,GA,USA,3–7April 2006;pp.48–60.)等人提出了基于概率模型的预测融合方法,此方法利用概率模型对网络属性进行描述,并利用数值概率对下一时刻的可能性取值进行预测。但是此模型并不适用于网络较为复杂的情况。A.Hui(参见文献A.Hui and L.Cui,“Forecast-based temporal data aggregation in wireless sensor networks,”Computer Engineering and Applications,vol.43,no.21,pp.121-125,July 2007.)等人和张西广(参见文献张西广,朱思峰,郑秋生,等.基于ARMA模型的低阶次无线传感网络数据融合算法[J].小型微型计算机系统,2014,35(8):1771-1774.)等人分别将自回归模型和ARMA模型应用至无线传感数据的预测之中,通过挖掘网络数据之间的时间相关性来预测数据。然而此类方法却无法适用于数据采集量较小的情况。

(2)基于复合预测模型的预测方法;为了解决单一预测模型无法实现数据量较小的情况下的有效预测,G.Wei(参见文献G.Wei,Y.Ling,B.Guo,B Xiao,and A.V.Vasilakos,“Prediction-based data aggregation in wireless sensor networks:combining grey model and Kalman Filter,”Computer Communications,vol.34,no.6,p-p.793-802,May 2011.)等人将灰色预测模型引入到融合方法当中。为了能够提升数据融合预测算法的精确性,Kang J等人将灰色预测模型分别与支持向量机模型和最小二乘法进行结合,提出了灰色预测模型支持向量机(Gray prediction model support vector machine,GMSVM)融合方法(参见文献Kang J,Tang L,Zuo X,et al.GMSVM-based prediction for temporal data aggregation in sensor networks[C]//International Conference on Wireless Communications,NETWORKING and Mobile Computing.IEEE,2009:1-4.)和灰色RBF核偏最小二乘法融合方法(参见文献Kang J,Tang L,Zuo X,et al.Grey Kernel Partial Least Squares-based prediction for temporal data aggregation in sensor networks[C]//IEEE International Conference on Intelligent Computing and Intelligent Systems.IEEE,2009:38-42.),对算法的运行效率和准确率进行相应的提升。X.LUO和王汝言等人分别把最小二乘支持向量机(least squares support vector machine,GM-LSSVM)(参见文献王汝言,唐季超,吴大鹏,等.WSN中基于GM-LSSVM的数据融合方法[J].计算机工程与设计,2012,33(9):3371-3375.)、(GM-OP-ELM)(参见文献Luo X,Chang X.A novel data fusion scheme using grey model and extreme learning machine in wireless sensor networks[J].International Journal of Control Automation&Systems,2015,13(3):539-546.)、内核递归最小二乘(kernel recursive least squares,KRLS)算法(参见文献Luo X,Zhang D,Yang L T,et al.A kernel machine-based secure data sensing and fusion scheme in wireless sensor networks for the cyber-physical systems[J].Future Generation Computer Systems,2016,61:85-96.)等算法引入到数据融合过程中,对算法的运行效率和精确性进一步进行提升。

(3)基于数据处理的预测方法。部分学者发现传感器采集数据本身存在较大不缺定性,并对源数据进行处理进行相应的研究。文献(参见文献Luo X,Liu J,Zhang D,et al.An Entropy-Based Kernel Learning Scheme toward Efficient Data Prediction in Cloud-Assisted Network Environments[J].Entropy,2016,18(8):274.)通过利用熵来对异常数据进行清理,并建立内核最小均方(kernel least mean square,E-KLMS)算法对数据序列进行预测。

以上方法在实际应用中,取得了较好的实践效果。然而,均存在着对时序数据空间关联性、不确定性考虑不足问题,数据传输消耗及误差还有进一步降低的空间。

发明内容

针对以上现有技术的问题,本方法提出了一种基于分簇DGM的无线传感器网络数据融合方法,包括以下步骤:

S1、对传感器分簇,设置簇头节点;传感器节点把前q个时刻的数据传给簇头节点,簇头节点将所述前q个时刻的数据传给汇聚节点,汇聚节点为簇头节点设置阈值;

S2、簇头节点和汇聚节点分别调用基于DGM的多传感器数据融合MS-DGM预测模型,根据所述原始数据,生成数据矩阵,所述簇头节点和汇聚节点分别得到第q+1时刻的数据预测值;

S3、簇头节点对第q+1时刻的实际数据进行标准化,求出的第q+1时刻的多传感器值与第q+1时刻的实际数据之间的误差序列;若误差大于阈值,簇头节点将第q+1时刻的实际数据传输到汇聚节点;更新汇聚节点的数据表;若误差小于阈值,汇聚节点直接采用第q+1时刻的数据预测值;

S4、采用更新后的汇聚节点的数据表作为原始数据,第q-N+2个数据到第q+1个数据作为原始数据,令q=q+1,跳至步骤S2;N表示为了预测的历史数据个数。

进一步的,获取原始数据,可以采用以下方式实现:

从英特尔伯克利实验室公开的传感器采集形成的数据集中获取温度和湿度数据作为历史数据。

步骤S1所述的根据传感器的空间位置,将传感器进行分簇,可以采用以下方式实现:

根据传感器的空间位置,将其进行分簇,并设置簇头节点。汇聚节点将可接受阈值ε广播给所有的簇头节点。在前q个时刻,所有的传感器节点将采集到的数据传输到簇头节点,簇头节点将所有数据传输到汇聚节点,无线传感器网络分簇结构如图3所示,以第一簇、第二簇以及第三簇中的簇头节点为中转站,传感器节点分别将数据传给簇头节点,簇头节点再分别将数据传给汇聚节点。

步骤S2所述的调用MS-DGM预测模型,可以采用以下方式实现:

从q+1时刻开始,簇头节点和汇聚节点在前q个时刻使用相同的数据构建MS-DGM模型;求出第q+1时刻的内核序列以及第q时刻与第q+1时刻间的面积序列;进而求出q+1时刻的预测值,其中n表示传感器节点的个数;

进一步的,S2中所述的MS-DGM模型,具体包括:

簇头节点和汇聚节点分别对数据矩阵中的异常点检测和补齐;对数据序列进行标准化;分别计算内核序列和面积序列;采用离散灰数DGM预测模型对数据序列的发展趋势进行建模预测;将多传感器与离散灰数DGM模型结合,从而构成多传感器数据融合MS-DGM预测模型。

进一步的,所述数据矩阵包括:

其中,所述数据矩阵的行表示时刻,所述数据矩阵的列表示传感器,xq,n表示第q时刻的第n个多传感器值。

进一步的,对所述数据矩阵中的异常点检测和补齐的方法为:

使用格拉布斯法检测数据矩阵中的异常值;使用新数据将所述数据矩阵中的异常值覆盖;具体包括:

令Xj=[xj,1,xj,2,..,xj,n],Xj表示第j时刻的数据序列也即是第j个离散灰数;xj,i表示第j时刻的第i个传感器值;j∈{1,2,...,q},i∈{1,2,...,n};n表示传感器个数;

令xm,i为异常值;使用新数据将异常值覆盖具体包括:

当m=1时,xm,i=x2,i

当2≤m≤q-1时,

当m=q时,xm,i=x(q-1),i

进一步的,对数据序列进行标准化的方法为:填充异常值后,将第j个离散灰数Xj=[xj,1,xj,2,..,xj,n]中的数据从小到大排序;得到第j个标准离散灰数所述标准离散灰数序列为:其中,表示第q个标准离散灰数,为排序过后的xj,i,也即是排序后的第j时刻的第i个传感器值;xj,i表示第j时刻的第i个传感器值;

内核序列的计算方法包括:

其中,

进一步的,面积序列的计算方法包括:

计算标准离散灰数序列中的每个灰单元映射到二维直角坐标平面上的灰单元格,根据梯形面积公式计算灰单元格面积Sj,i,得到面积序列Si

灰单元格面积Sj,i的计算的公式为:

所述面积序列为:Si=(s1,i,s2,i,...,sq-1,i),Si表示第i个传感器与第i+1个传感器间对应的q-1个灰单元格面积;sq-1,i表示由x(1)q-1,i、x(1)q-1,i+1、x(1)q,i以及x(1)q,i+1构成的灰单元格面积,也即是第q-1个时刻到第q时刻间的第i个传感器与第q-1个时刻到第q时刻间的第i+1个传感器之间的灰单元格面积,其中,显而易见的i+1≤n,j+1≤q。

其中,根据数学关系可以知道,Sj,i中j,i取得最大时的灰单元格面积为Sq-1,n-1,得到面积序列Sq-1

灰单元格面积Sq-1的计算的公式为:

Sq-1=(sq-1,1,sq-1,2,...,sq-1,n-1);Sq-1表示第q-1时刻的n个传感器对应的n-1个灰单元格面积;sq-1,n-1表示第q-1个时刻到第q时刻间的第n-1个传感器与第q-1个时刻到第q时刻间的第n个传感器之间的灰单元格面积。

进一步的,对内核序列和面积序列的发展趋势进行建模预测的方法为:

构建离散灰色DGM(1,1)预测模型;以内核序列和面积序列Si为原始序列,分别构建内核序列DGM预测模型和面积序列DGM预测模型;获取第q+1时刻的内核以及第q时刻与第q+1时刻间的面积序列表示第q+1时刻的内核,sq,1,...,sq,n-1表示第q时刻与第q+1时刻间的n个传感器对应的n-1个灰单元格面积;

在第q+1时刻,通过内核序列与面积序列Si以及构造扩展后的矩阵,调用扩展后的矩阵对应的方程,得到第q+1时刻的多传感器值[xq+1,1,xq+1,2,...,xq+1,n],xq+1,n表示第q+1时刻的第n个传感器值。

进一步的,第q+1时刻的多传感器值的计算方法包括:,根据所述扩展后的矩阵对应的方程,构成多元方程组求解[xq+1,1,xq+1,2,...,xq+1,n]:

作为一种可实现方式,步骤S3所述的更新数据表,可以采用以下方式实现:

在簇头节点上,对q+1时刻的实际数据进行标准化,然后求出的q+1时刻的多传感器值与q+1时刻的实际数据之间的误差集合其中如果簇头节点不需要将实际数据传输到汇聚节点,使得传输被消除,能量被保存,否则簇头节点将实际数据传输到汇聚节点并更新汇聚节点的数据表。

本发明的有益效果:本发明能有效地对异常点进行检测和补齐,提升数据的可靠性,且将多个传感器的数据当作整体看待,利用数据之间的空间关联性进行预测数据的修正,有效地提升数据预测的准确性,减少了簇头节点和汇聚节点之间的数据发送量。本发明利用传感器节点的空间距离进行动态分簇,有效减少传感器节点的传输距离,降低传感器节点的传输能耗,且减少了汇聚节点的对接点数,缓解了网络拥塞问题。

附图说明

图1为本方法基于分簇DGM预测模型的无线传感器网络数据融合方法优选实施例流程示意图;

图2为MS-DGM模型的流程图;

图3为无线传感器网络分簇结构;

图4为标准离散灰数序列的灰单元格及灰单元层;

图5为MS-DGM的预测误差;

图6为MS-DGM的预测与仿真值。

具体实施方式

下面结合附图说明和具体实施方式对本方法的基于分簇DGM的无线传感器网络数据融合方法的实施例做进一步说明。

为了方便描述,数据序列是数据矩阵中的某一时刻的数据。

实施例1

本发明的一种基于分簇DGM的无线传感器网络数据融合方法,包括以下步骤:

S11、根据传感器的空间位置,将传感器进行分簇,设置簇头节点;传感器节点将采集到的前q个时刻的数据传输到簇头节点;簇头节点将所述数据传输给汇聚节点;

S21、调用基于DGM的多传感器数据融合MS-DGM预测模型,根据所述原始数据,生成数据矩阵,求出第q+1时刻的数据预测值;

S31、在簇头节点上,对第q+1时刻的实际数据进行标准化,求出的第q+1时刻的多传感器值与第q+1时刻的实际数据之间的误差集合如果簇头节点将实际数据传输到汇聚节点并更新汇聚节点的数据表;其中,表示第q+1时刻的多传感器值与第q+1时刻的实际数据之间第i个数据的误差;xq+1,i表示第q+1时刻的第i个数据,表示第q+1时刻的第i个的实际数据,ε表示可接受阈值ε;

进一步的,作为一种可选方式,如图2所示,步骤S21具体包括:

S201、获取传感器采集数据;生成数据矩阵;

S202、对所述数据矩阵中的异常点检测和补齐;

S203、对数据序列进行标准化;

S204、计算内核序列和面积序列;

S205、采用离散灰数DGM预测模型对数据序列发展趋势进行建模预测。

进一步的,所述数据矩阵包括:

其中,所述数据矩阵的行表示时刻,所述数据矩阵的列表示传感器,xq,n表示第q时刻的第n个多传感器值。

作为一种可实现方式,步骤S201所述的获取传感器采集数据,可以采用以下方式实现:

从英特尔伯克利实验室公开的传感器采集形成的数据集中获取温度和湿度数据作为历史数据。为证明MS-DGM方案能够有效地处理带有异常值的序列,在原始序列中随机生成一个异常值,建模序列如表1所示。

表1建模序列

作为一种可实现方式,步骤S2所述对数据矩阵中的异常点进行检测和补齐,可以采用以下方式实现:

S202A、检测异常值。离散灰色模型DGM(1,1)是最常用的灰色预测模型之一,它可以被看作是灰色预测模型的精确形式。在DGM(1,1)中,最初的非负时间数据序列被定义为X(0)=[x(0)(1),x(0)(2),...,x(0)(n)],其中x(0)(k)指的是时间数据序列在k时刻的值,n为数据序列长度,使用此定义可以检测出异常值;通过检测,可以发现在第4时刻N5的数据是一个异常值(置信水平为α=0.95)。

S202B、使用新数据将所述数据矩阵中的异常值覆盖;包括:

令Xj=[xj,1,xj,2,..,xj,n],Xj表示第j时刻的数据序列;xj,i表示第j时刻的第i个传感器值;j∈{1,2,...,q},i∈{1,2,...,n};n表示传感器个数;

令xm,i为异常值;使用新数据将异常值覆盖具体包括:

当m=1时,xm,i=x2,i

当2≤m≤q-1时,

当m=q时,xm,i=x(q-1),i;因此可以使用新数据填充第4时刻N5的异常值。

作为一种可实现方式,步骤S203所述标准化数据序列,可以采用以下方式实现:

填充异常值后,令X(1)j为第j个离散灰数Xj=[xj,1,xj,2,..,xj,n]中的数据从小到大排序的结果,即第j时刻的标准离散灰数X(1)j=[x(1)j,1,x(1)j,2,..,x(1)j,n],为排序过后的xj,n,xj,n表示第j时刻的第n个传感器值;其中

作为一种可实现方式,步骤S204所述计算内核序列和面积序列,可以采用以下方式实现:

S204A、计算内核序列;

具体包括:第j个离散灰数Xj=[xj,1,xj,2,..,xj,n]中的数据从小到大排序;得到第j个标准离散灰数从而获得标准离散灰数序列,根据所述标准离散灰数序列得到内核序列;

所述标准离散灰数序列为:

所述内核序列包括:如图4所示;相邻的图像灰数对应于离散点称为灰色细胞。从左到右的灰色细胞组成了一个长条形图形,称为灰单元层,可以看出,q×n个数据可以构成(q-1)×(n-1)个长条形区域,每一个长条形区域被称作灰单元格,该灰单元格的面积被称作灰单元格面积。

其中,表示第q个标准离散灰数,为排序过后的xj,i,也即是排序后的第j时刻的第i个传感器值;xj,i表示第j时刻的第i个传感器值;

S204B、计算面积序列:计算标准离散灰数序列中的每个灰色单元映射到二维直角坐标平面上的灰单元格,根据梯形面积公式计算灰单元格面积Sj,i,得到面积序列Si

灰单元格面积Sj,i的计算的公式为:

所述面积序列为:Si=(s1,i,s2,i,...,sq-1,i),Si表示第i个传感器与第i+1个传感器间对应的q-1个灰单元格面积;sq-1,i表示由x(1)q-1,i、x(1)q-1,i+1、x(1)q,i以及x(1)q,i+1构成的灰单元格面积,也即是第q-1个时刻到第q时刻间的第i个传感器与第q-1个时刻到第q时刻间的第i+1个传感器之间的灰单元格面积。

其中,根据数学关系可以知道,Sj,i中j,i取得最大时的灰单元格面积为Sq-1,n-1,得到面积序列Sq-1

灰单元格面积Sq-1的计算的公式为:

所述面积序列为:Sq-1=(sq-1,1,sq-1,2,...,sq-1,n-1);Sq-1表示第q-1时刻的n个传感器对应的n-1个灰单元格面积;sq-1,n-1表示第q-1个时刻到第q时刻间的第n-1个传感器与第q-1个时刻到第q时刻间的第n个传感器之间的灰单元格面积。

所述S205采用离散灰数DGM预测模型对数据序列的发展趋势进行建模预测包括:

S205A、构建离散灰色DGM(1,1)预测模型;以内核序列和面积序列Si为原始序列,分别构建内核序列DGM预测模型和面积序列DGM预测模型;获取q+1时刻的内核和灰度值得到关键预测值以及第q+1时刻的面积序列;表示q+1时刻的内核,sq,1,...,sq,n-1表示第q时刻与第q+1时刻间的n个传感器对应的n-1个灰单元格面积;

S205B、计算q+1时刻的多传感器预测值;在第一个q+1时刻,通过内核序列和面积序列Si以及构造扩展后的矩阵,调用所述扩展后的矩阵的对应的方程,得到q+1时刻的多传感器值[xq+1,1,xq+1,2,...,xq+1,n],xq+1,n表示第q+1时刻的第n个传感器值;

根据步骤S205中的内核公式与面积公式构成多元方程组求解[xi+1,1,xi+1,2,...,xi+1,j],包括:

其中,xq+1,n表示第q+1时刻的第n个传感器值;sq,n-1表示第q+1时刻的第n-1个灰度值。

本发明根据表1的8个时刻中的前6个时刻对于的N1-N6的六个传感器的对应的36个数据,也即是q=6,n=6获取的第7时刻的内核和第6时刻与第7时刻间的6个传感器对应的5个灰单元格面积包括:

进一步的,本发明得到的第q+1时刻的数据预测值如下:

其中,Xq+1=[38.4152,38.7963,39.4778,39.5802,39.5802,40.0086];

实验结果如图5和图6所示;可以看出,本发明采用的方法所预测出的数据的误差非常小,本发明采用的MS-DGM方法数据预测的成功率较比其他方法的成功率更高,其中,Sensor node ID表示传感器节点ID;predicted error(℃)表示预测误差;thresholdε表示阈值;successful prediction rate表示预测成功率;GM(Grey model)表示灰色模型,在DGM方法中采用了该技术;同理,GM-LSSVM中也采用了LSSVM,E-KLMS是基于KLMS技术的改进,图中GM-OP-ELM等方法均为现有技术,在背景技术中都有提及,此处不再赘述。

实施例2

本实施例较实施例1还多出以下步骤,包括:

S41、采用更新后的数据表作为原始数据,将第q-N+2个数据到第q+1个数据作为原始数据,q=q+1,返回步骤S2,N表示为了预测的历史数据个数,N可以是第一次循环的q的值,也可以是第一次循环的比q小的值,例如,原始数据中有100时刻的数据(q=100),N可以为100,也可以是小于100的值。

本实施例不仅能够实现第q+1时刻的数据预测,还能够实现下一个q+1时刻的数据预测,以及后面时刻的数据。

本方法能有效地对异常点进行检测和补齐,提升数据的可靠性,且将多个传感器的数据当作整体看待,利用数据之间的空间关联性进行预测数据的修正,有效地提升数据预测的准确性,减少了簇头节点和汇聚节点之间的数据发送量。

本方法利用传感器节点的空间距离进行动态分簇,有效减少传感器节点的传输距离,降低传感器节点的传输能耗,且减少了汇聚节点的对接点数,缓解了网络拥塞问题。本方法可以有效地将无线传感器网络数据融合应用到各个行业中。

以上所举实施例,对本方法的目的、技术方法和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本方法的优选实施方式而已,并不用以限制本方法,凡在本方法的精神和原则之内对本方法所作的任何修改、等同替换、改进等,均应包含在本方法的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号