首页> 中国专利> 一种传感器网络中分组丢失和错误的原因识别方法和系统

一种传感器网络中分组丢失和错误的原因识别方法和系统

摘要

本发明公开了一种传感器网络中分组丢失和错误的原因识别方法和系统。包括:在实验传感器网络中,获得多个实验样本分组,建立二元分类器;通过二元分类器,识别真实传感器网络中分组丢失和错误的原因。本发明为传感器网络高性能的数据传输提供了关键保障。

著录项

  • 公开/公告号CN103716123A

    专利类型发明专利

  • 公开/公告日2014-04-09

    原文格式PDF

  • 申请/专利权人 中国科学院计算技术研究所;

    申请/专利号CN201210380531.9

  • 发明设计人 黄庭培;陈海明;张招亮;崔莉;

    申请日2012-09-29

  • 分类号H04L1/00(20060101);H04W24/08(20090101);H04W84/18(20090101);

  • 代理机构11006 北京律诚同业知识产权代理有限公司;

  • 代理人祁建国;梁挥

  • 地址 100190 北京市海淀区中关村科学院南路6号

  • 入库时间 2024-02-19 23:06:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-12-21

    授权

    授权

  • 2014-05-07

    实质审查的生效 IPC(主分类):H04L1/00 申请日:20120929

    实质审查的生效

  • 2014-04-09

    公开

    公开

说明书

技术领域

本发明涉及无线传感器网络链路感知与控制领域,尤其涉及一种传感器网 络中分组丢失和错误的原因识别方法和系统。

背景技术

随着物联网技术的提出与不断发展,面向各种应用需求的物联网前端无线 传感器网络在工业、军事和民用领域得到了广泛的应用,如室内外环境监测、 智能家居、远程医疗及精准农业等。目前无线传感器网络设备大多工作在ISM 频段,采用无线介质进行通信,无线信道固有的广播特性导致其它工作在ISM 频段的高功率网络或设备,如802.11网络、家用电器如微波炉和无绳电话等 会干扰传感器节点间的通信。同时无线传感器网络一般部署在复杂的环境中, 无线通信会受到天气、障碍物等因素的影响。从而导致网络中频繁的数据分组 丢失和错误。并且传感器节点射频硬件本身存在性能差异。因此,在实际应用 系统部署过程中考虑影响无线通信质量的各种因素,为传感器网络数据传输提 供及时、可靠的链路状态信息,是实现高性能网络协议的基础。

一般可将导致分组丢失和错误的因素分为以下两大类:一是信号衰减、信 道衰落、多径传播或节点移动等引起的无线链路本身质量不好,从而导致分组 丢失和错误,称之为信道错误类发送失败;二是由隐藏终端、或多个节点同时 向接收节点发送数据而产生的冲突、或其它高功率网络干扰而引起的分组丢失 和错误,称之为冲突类发送失败。传统基于竞争信道访问方式的无线网络采用 确认机制来判断分组发送结果:如果接收到确认分组,则分组发送成功,如果 在规定的时间内未收到确认分组,则认为是冲突导致的分组丢失和错误。这种 在发送方基于确认机制的分组发送结果识别方法不能反映接收方接收分组的 实际情况。如何准确而高效地识别分组丢失和错误的原因对设计高性能的网络 协议具有重要和基础性的意义。如功率控制协议根据识别结果动态调整发送功 率的大小;链路层根据识别结果自适应调整信道访问策略;路由协议根据识别 结果选择可靠稳定的路径收集数据;而传输层拥塞控制协议根据识别结果设计 高效的速率自适应协议。

已有方法大部分是针对802.11网络中分组发送失败(包括丢失和错误)的 原因进行识别的。如采用RTS(Request-to-Send)/CTS(Clear-to-Send)控制分 组来识别冲突类还是信道错误类发送失败。但是RTS/CTS控制分组会引入大的 控制开销,大大降低了信道的利用率。从而现有无线网络设备一般会禁用 RTS/CTS功能。也有方法通过将整个错误的分组返回给发送节点这种策略来诊 断分组出错的原因,但该方法会引入大的控制开销,不适合存储和能量资源都 有限的传感器节点。还有结合RTS/CTS和数据分段两种机制来区分物理层丢包 和拥塞类丢包,通过分析802.11n标准下块确认位图的损耗模式来区分弱信号 类和冲突类丢包。由于802.15.4和802.11物理层标准不同,最后两种方法都 不能直接应用于传感器网络。也有方法通过分析物理层比特误码率BER(Bit  Error Rate)的突发性特征来判断是否有冲突发生,但该方法需要额外的硬件 支持,很难在低成本的传感器节点上实现。

也有少数针对无线传感器网络提出分组丢失和错误的原因识别方法。如通 过分析接收信号强度指示符(RSSI:Received Signal Strength Indicator) 和链路质量指示符(LQI:Link Quality Indicator)在弱信号和冲突环境下的 统计分布特征来分类分组发送结果,但该方法需要实时采集RSSI值,会引入 大的能量开销。也有方法通过分析802.15.4的物理层片错误模式(CEP:Chip  Error Pattern)的统计特征来识别链路当前状态,但该方法是在USRP (Universal Software Radio Peripheral)设备上实现的,在普通传感器节 点上很难实现,因此实用价值小。并且该方法只考虑了同种802.15.4网络内 部间的干扰,而未考虑不同网络或设备对传感器节点通信的干扰。

因此,在传感器网络中实现高效可行的分组丢失和错误的原因识别方法需 要解决以下两个方面的挑战:

(1)影响因素提取与分析。由于实际传感器网络应用中节点间的通信受 到地理环境、天气、干扰或障碍物等很多因素的影响,获取真实网络中节点间 的通信状况代价大,且会影响传感器网络的正常运行。如何提取影响当前分组 丢失和错误的主要因素是分组丢失和错误原因识别问题面临的最大挑战;

(2)在传感器节点上实现在线、实时和自适应的轻量级识别算法。因为 受限的传感器节点资源及高度动态变化的通信状态,所以需要识别方法易于在 节点上实现,且开销低、自适应性强。

本发明公开的基于机器学习理论的传感器网络分组丢失和错误的原因识 别方法和系统,能够有效解决上述挑战,具有轻量级的、准确实时和易于在实 际传感器网络中实现的特点。

发明内容

本发明的目的在于,克服现有技术的缺陷,设计轻量级的、准确实时的、 易于在实际传感器网络中实现的分组丢失和错误的原因识别方法和系统,为传 感器网络高性能的数据传输提供关键保障。

本发明公开了一种传感器网络中分组丢失和错误的原因识别方法,包括:

步骤1:在实验传感器网络中,获得多个实验样本分组,建立二元分类器;

步骤2:通过所述二元分类器,识别真实传感器网络中分组丢失和错误的 原因。

所述步骤1包括:

步骤1.1:建立第一实验样本分组,提取分组丢失和错误的特征属性;

步骤1.2:建立第二实验样本分组;

步骤1.3:获得分组丢失和错误的所述第二实验样本分组的分组丢失和错 误的原因;

步骤1.4:计算所述分组丢失和错误的第二实验样本分组的所述特征属性 的特征属性值,根据所述特征属性值和所述分组丢失和错误的原因建立所述二 元分类器。

所述步骤2包括:

步骤2.1:计算所述真实传感器网络的分组丢失和错误的分组的所述特征 属性的所述特征属性值;

步骤2.2:将所述特征属性值输入所述二元分类器,获得所述真实传感器 网络的分组丢失和错误的原因。

所述特征属性包括一时间段内正确分组的接收信号强度指示符RSSI平均 值、所述时间段内所述正确分组的链路质量指示符LQI平均值、单个丢失或错 误分组的RSSI瞬时值相比所述时间段内所述正确分组的RSSI均值的变化幅 度、分组级比特误码率和所述时间段内全部分组中分组头部出错的概率。

所述实验传感器网络包括信道错误主导的实验传感器网络、冲突主导的实 验传感器网络和信道错误和冲突都存在的实验传感器网络。

所述分组丢失和错误原因包括信道错误和冲突。

通过朴素贝叶斯、逻辑回归模型和决策树分类器的任一算法建立所述二元 分类器。

本发明还公开了一种传感器网络中分组丢失和错误的原因识别系统,包 括:

二元分类器建立模块,用于在实验传感器网络中,获得多个实验样本分组, 建立二元分类器;

原因识别模块,用于通过所述二元分类器,识别真实传感器网络中分组丢 失和错误的原因。

所述二元分类器建立模块包括:

特征属性提取子模块,用于建立第一实验样本分组,提取分组丢失和错误 的特征属性;

样本采集子模块,用于建立第二实验样本分组;

原因获得子模块,用于获得分组丢失和错误的所述第二实验样本分组的分 组丢失和错误的原因;

监督学习子模块,用于计算所述分组丢失和错误的第二实验样本分组的所 述特征属性的特征属性值,根据所述特征属性值和所述分组丢失和错误的原因 建立二元分类器。

所述原因识别模块包括:

在线特征属性值预测子模块,用于计算所述真实传感器网络的分组丢失和 错误的分组的所述特征属性的所述特征属性值;

在线识别子模块,用于将所述特征属性值输入所述二元分类器,获得所述 真实传感器网络的分组丢失和错误的原因。

本发明的有益效果在于:能够有效识别分组丢失和错误的原因,为无线传 感器网络链路层及上层协议提供实时、准确的链路质量信息。

附图说明

图1为本发明的方法的总流程图。

图2为图1中建立二元分类器的方法的流程图。

图3为图1中识别真实传感器网络中分组丢失和错误的原因的方法的流程 图。

图4为本发明使用的CC2420分组格式。

图5为本发明的传感器设备性能测试的示意图。

图6A为本发明在信道错误和冲突的环境中所测量的丢失和错误分组的 F-BER累计分布的示意图。

图6B为本发明在802.11干扰和802.15.4干扰的环境中所测量的丢失和 错误分组的F-BER累计分布的示意图。

图7为本发明的特征属性定义的示意图。

图8为本发明的系统结构图的一实施例。

图9为图8中二元分类器建立模块的结构图。

图10为图8中原因识别模块的结构图。

图11为本发明的系统结构图的另一实施例。

具体实施方式

下面结合实施例和附图对本发明的技术方案进行详细地介绍。

图1为本发明的方法的总流程图,包括如下步骤:(S1)在实验传感器网络 中,获得多个实验样本分组,建立二元分类器;(S2)通过二元分类器,识别真 实传感器网络中分组丢失和错误的原因。

图2为图1中建立二元分类器的方法的流程图。包括如下步骤:(S21)建 立第一实验样本分组,提取分组丢失和错误的特征属性;(S22)建立第二实验 样本分组;(S23)获得分组丢失和错误的第二实验样本分组的分组丢失和错误 的原因;(S24)计算分组丢失和错误的第二实验样本分组的特征属性的特征属 性值,根据特征属性值和分组丢失和错误的原因建立所述二元分类器。

步骤S21:建立第一实验样本分组,提取分组丢失和错误的特征属性,即 特征属性提取。

首先,在不同的实验传感器网络中,对传感器接收的分组(第一实验样本 分组)进行测量,对接收到的错误分组的F-BER分布模式和接收到的所有分组 的RSSI和LQI的具有统计特征的属性进行分析,提取表征实验传感器网络的 分组丢失和错误的特征属性。本实施例使用带有CC2420射频接口的传感器, 三种实验传感器网络为:信道错误主导的实验传感器网络、冲突主导的实验传 感器网络、信道错误和冲突并存的实验传感器网络,这三种实验传感器网络的 分组丢失和错误的状态可以通过对发送节点间的通信距离和发送功率的调节 来实现。

图4是本发明使用的CC2420分组格式。根据“序列号”字段可以判断分 组是否丢失,因为分组的序列号是顺序递增的,从而根据“序列号”字段即可 判断分组是否丢失。根据“CRC校验序列”字段可以判断分组是否错误。CRC 校验通过则表明分组正确接收,否则说明分组发生错误。

图5是本发明所用传感器设备的性能测试结果的示意图。横坐标是节点的 ID号,左侧纵坐标表示节点的实际输出功率,右侧纵坐标表示丢包率。该图 表明不同节点之间的性能存在差异。在相同实验条件下(具体实验条件为:发 送功率:0dBm;工作信道:26;距离:30米左右;测试时间:凌晨1-3点; 测试地点:中科院计算所7层实验室;没有重传机制)对每个传感器节点进行 性能测试,105号节点的实际输出功率为-3.18dBm,丢包率为10.22%,而106 号节点的实际输出功率为-4.04dBM,丢包率为18.89%。

本实施例中,通过对上述三种网络中的F-BER的累计分布和RSSI、LQI 的均值、方差进行统计分析,提取以图7所定义的五种特征属性来表征网络中 分组丢失和错误的情况,本实施例中,“一段时间”可以是5秒、10秒等。 其中,对Dev(RSSI)和R(F-BER,H)的计算公式定义如下。

Dev(RSSI)的计算公式:

Dev(RSSI)=(Mean(RSSI,C)-Inst(RSSI,E))2    (1)

其中,Inst(RSSI,E)是接收到的错误分组或者丢失分组的瞬时RSSI值, C表示正确分组,E表示错误分组或者丢失分组。

R(F-BER,H)的计算公式:

步骤S22:建立第二实验样本分组,即样本采集。

对二元分类器的离线训练与检验需要采集大量的样本分组,即第二实验样 本分组。本实施例采用实地场景统计实验的方法在三种不同的通信环境进行了 大量的实验,采集了大量的样本分组。本实施例中,三种不同的通信环境为: 公寓、办公楼顶层和一网络实验室。在信道错误主导环境中主要测量了信道错 误主导环境下节点接收数据的情况(信道错误主导的通信环境)和802.15.4 网络干扰主导情况下节点接收数据的情况(信道错误和冲突并存的通信环境)。 在冲突干扰环境下中主要测量了802.15.4和802.11网络干扰环境下节点接收 数据的情况(冲突主导的通信环境)。其中,公寓为信道错误主导的通信环境, 办公楼顶层为信道错误和冲突错误并存(包括信道错误和802.15.4冲突干扰) 的通信环境。而网络实验室为冲突主导(包括802.15.4和802.11两种冲突干 扰)的通信环境。

图6A和图6B是F-BER在不同环境下的累计分布的示意图。横坐标表示分 组级比特误码率F-BER,纵坐标表示F-BER的累积分布。图6A显示了在公寓、 办公室顶层和一网络实验室三种实验传感器网络中CDF与F-BER之间的关系。 图6A表明信道错误和冲突两种环境下,F-BER呈现出不同的分布模式。因冲 突干扰导致的错误分组的F-BER的分布比信道错误引起的错误分组的F-BER 的分布要宽.例如,90%因信道错误引起的错误分组的F-BER只有3%或更少, 但是只有25%因冲突干扰引起的错误分组的F-BER占3%或更少。图6B显示了 在办公室楼顶层和网络实验室两种实验传感器网络中CDF与F-BER之间的关 系。图6B表明在高功率网络干扰(802.11)和同种网络内部干扰(802.15.4)环 境下,错误分组的F-BER呈现相似的累积分布模式。图6A中的每种网络中都 存在两种长度的分组,长度分别是87字节和127字节。6A图中的Dor表示公 寓,Roof表示办公楼顶层,Lab表示网络实验室。图6B中的每种网络中都存 在三种长度的分组,长度分别是22字节、87字节和127字节。6B图中的Roof 表示办公楼顶层,Lab表示网络实验室。

步骤S23:获得分组丢失和错误的第二实验样本分组的分组丢失和错误的 原因,即标记分类输出。

本发明采用二元(BM,Binary Model)分类模型,将分类输出标记为信道错 误和冲突两类。也就是,对步骤S22中采集的样本分组,将每个丢失或错误的 样本分组进行标记,即标记为信道错误或者冲突。

步骤S24:计算分组丢失和错误的第二实验样本分组的特征属性的特征属 性值,根据特征属性值和分组丢失和错误的原因建立二元分类器。即二元分类 器建立。

计算分组丢失和错误的第二实验样本分组的特征属性的特征属性值的方 法,请见步骤S31。

将分组丢失和错误的第二实验样本分组的特征属性的特征属性值集和对 应的分组丢失和错误的原因作为离线训练用的样例数据集,建立分组丢失和错 误原因识别数学模型,即二元分类器。二元分类器以图7给出的五种特征属性 组成的特征向量作为输入,输出引起分组丢失和错误的原因。用表示输入特 征向量,则有

x=[Mean(RSSI,C),Dev(RSSI),Mean(LQI,C),F-BER,R(F-BER,H)]T,

所有特征属性值都是离散的。F-BER和R(F-BER,H)的取值范围为[0,1], RSSI和LQI具有不同的取值范围,分别为[-100,0]dBm和[50,110],而 Dev(RSSI)的取值范围为[0,104]。对Mean(RSSI,C)、Mean(LQI,C)和Dev(RSSI) 进行归一化处理,使得它们的取值范围为[0,1]。用y表示二元分类器的输出, 则y赋值为0表示是信道错误导致的分组丢失和错误,1表示是冲突。

对二元分类器通过监督学习方法进行离线训练和检验。本发明分别采用了 常用的监督学习方法贝叶斯分类器、逻辑回归和决策树分类器对二元分类器进 行离线训练和检验。具体是在Weka平台上对二元分类器进行训练和检验。在 具体训练和检验实验中,朴素贝叶斯分类算法使用拉普拉斯校准避免零概率值 问题。逻辑回归分类器使用岭估计器(Ridge Estimator)避免过分拟合 (Overfitting)数据的问题。本发明使用C4.5决策树算法,该算法使用信息增 益率作为属性选择的度量,使用悲观剪枝方法来处理过分拟合数据的问题。本 发明用数据挖掘领域广泛使用的K-折交叉确认(K-fold Cross-Validation) 对样本集进行训练和检验,以避免过分拟合数据和大的存储空间。在具体训练 和检验时使用了10-折交叉确认,并采用配对t统计显著性检验方法对比分析 了三种二元分类器的性能。

图3为图1中识别真实传感器网络中分组丢失和错误的原因的方法的流程 图。包括如下步骤:(S31)计算真实传感器网络的分组丢失和错误的分组的 特征属性的特征属性值;(S32)将特征属性值输入二元分类器,获得真实传 感器网络的分组丢失和错误的原因。

步骤S31:计算真实传感器网络的分组丢失和错误的分组的特征属性的特 征属性值。即在线特征属性值预测。

步骤S24中计算特征属性的特征属性值的过程与本步骤计算特征属性值 的计算方法是相同的。下面对特征属性值计算方法进行具体介绍。

特征属性F-BER值采用如下两种计算方法:

1)控制分组的F-BER估计方法。因为传感器网络需要周期性地发送控制 分组完成组网、配置调试等功能,例如:路由程序通过周期性地发送探测分组 建立路由,网关节点周期性地发送控制命令对网络进行配置或查询,这类控制 分组的大部分内容对所有无线传感器节点都是已知的。所以可以通过这些已知 内容的控制分组来计算F-BER。

2)数据分组的F-BER估计方法。为了提供可靠的链路层通信,传感器网 络中链路层协议一般都提供了链路层重传功能。接收节点在接收到错误分组 时,存储下来,当接收到最终正确分组时,通过比较正确分组和错误分组来计 算F-BER值。如果节点在接收到正确分组之前接收到多份错误分组,则计算每 一个错误分组的F-BER值,最终F-BER值为多份错误分组的F-BER值的平均值。

本步骤实现时结合上述两种方法。在步骤S24的离线训练阶段,采用1)控 制分组的F-BER估计方法,通过发送已知控制分组和接收到的分组情况来计算 F-BER值,从而获得离线训练用的样例数据。而在真实传感器网络中是采用1) 控制分组的F-BER估计方法和2)数据分组的F-BER估计方法相结合的F-BER 计算方法,即接收到控制分组采用1)的方法计算,接收到数据分组采用2)的 方法计算。

特征属性Mean(RSSI,C)、Mean(LQI,C)和R(F-BER,H)是使用下述的误差滤 波器进行在线实时的预测。基于误差滤波器的特征值预测模型定义如下:

Featt=αFeatt-1+(1-α)Featnew

其中,Featnew代表图7中所定义的Mean(RSSI,C)、Mean(LQI,C)和 R(F-BER,H)的任一特征属性的当前时刻测量值。t代表当前时刻,t-1代表前 一时刻,而Featt-1是特征属性的历史估计值(前一时刻估计值),Featt是特 征属性的当前时刻估计值。α是平滑因子,其定义如下:

α=1-δtδmax,

其中δt表示误差滤波器的预测能力,能够自适应地控制误差滤波器的预测 误差。因此,又称δt为估计器误差。如果误差滤波器的预测值与实际值相匹配, 则增加历史估计值的权重,否则,通过降低平滑因子α的值来降低历史估计值 的权重。δt是历史估计值和当前时刻测量值之间差的绝对值。误差滤波器不直 接使用绝对差值,而是通过指数加权移动平均滤波器对δt进行二次平滑处理。

δt=βδt-1+(1-β)|Featt-1-Featnew|.

δmax是特征值估计窗口内估计误差的最大值,β是平滑因子。

特征属性Dev(RSSI)是通过公式(1)计算得出,其中,Mean(RSSI,C)根 据误差滤波器的特征值预测模型计算得到,Inst(RSSI,E)为当前时刻测量值。

因为传感器节点接收不到丢失的分组,如果t时刻对应的是丢失分组,那 么丢失的分组的特征属性值的计算,要根据历史经验值赋值或者预测。本实施 例中,将t时刻对应的丢失的分组的RSSI和LQI的瞬时值赋值为最小值,分 别为-100和50;F-BER和R(F-BER,H)的值取为最近“一段时间”内的平均值。 例如:t-1到t的长度为1秒,即每隔1秒发送一个分组,“一段时间”为5 秒,若t=10即第10秒时未接收到分组,即分组丢失了,t-5,t-4,t-3,t-2, t-1时刻的R(F-BER,H)值分别为0.03,0.04,0.02,0.03,0.02,F-BER为 0.11,0.24,0.15,0.2,0.13,则此时丢失分组的R(F-BER,H)值为 (0.03+0.04+0.02+0.03+0.02)/5=0.028,F-BER值为(0.11+0.24+0.15+0.2 +0.13)/5=0.166。

步骤S32:将特征属性值输入二元分类器,获得真实传感器网络的分组丢 失和错误的原因。即在线识别。

以步骤S31计算的特征属性值的特征向量作为二元分类器的输入,输出当 前造成真实传感器网络分组丢失和错误的原因,即信道错误或冲突。

图8为本发明的系统结构图的一实施例,包括如下模块:二元分类器建立 模块M1和原因识别模块M2。

二元分类器建立模块M1,用于在实验传感器网络中,获得多个实验样本 分组,建立二元分类器;

原因识别模块M2,用于通过二元分类器,识别真实传感器网络中分组丢 失和错误的原因。

图9为图8中二元分类器建立模块的结构图,包括如下子模块:特征属性 提取子模块M91、样本采集子模块M92、原因获得子模块M93和监督学习子模 块M94。

特征属性提取子模块M91,用于建立第一实验样本分组,提取分组丢失和 错误的特征属性;

样本采集子模块M92,用于建立第二实验样本分组;

原因获得子模块M93,用于获得分组丢失和错误的第二实验样本分组的分 组丢失和错误的原因;

监督学习子模块M94,用于计算分组丢失和错误的第二实验样本分组的特 征属性的特征属性值,根据特征属性值和分组丢失和错误的原因建立二元分类 器。

图10为图8中原因识别模块的结构图。包括如下子模块:在线特征属性 值预测子模块M101和在线识别子模块M102。

在线特征属性值预测子模块M101,用于计算所述真实传感器网络的分组 丢失和错误的分组的特征属性的特征属性值;

在线识别子模块M102,用于将特征属性值输入所述二元分类器,获得真 实传感器网络的分组丢失和错误的原因。

图11为本发明的系统结构图的另一实施例。包括特征属性提取子模块 M111、样本采集子模块M112、原因获得子模块M113、监督学习子模块M114、 在线特征属性值预测子模块M115和在线识别子模块M116。

以上,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,任 何所属技术领域的技术人员,若在不脱离本发明所提出技术特征的范围内,利 用本发明所公开的技术内容所做出局部更动或修改的等效实施例,并且未脱离 本发明的技术特征内容,均仍属于本发明技术特征的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号