首页> 中国专利> 基于随机自动学习机与模糊算法的高吞吐量中继选择方法

基于随机自动学习机与模糊算法的高吞吐量中继选择方法

摘要

本发明公布了一种基于随机自动学习机与模糊算法的高吞吐量中继选择方法。主要解决在无线传感网中由于子节点和协调器之间链路损耗大使网络性能严重下降的问题。所述的方法包括:通过将无线传感网和随机自动学习机相结合,源节点可以通过学习的方式,找到最佳中继,使系统达到平衡稳定的状态。对于中继节点将接收到的数据进行AF转发,不同传感器数据拥有不同优先级。具有高优先级的节点在一帧内可以多次接入信道,发送成功的概率高。中继节点采用模糊算法,实现负载均衡。本发明的实施例,保证节点在运行期间内无需人为干预,可以自适应的达到稳定状态,使网络整体吞吐量最大化,具有广泛的应用价值。

著录项

  • 公开/公告号CN108712760A

    专利类型发明专利

  • 公开/公告日2018-10-26

    原文格式PDF

  • 申请/专利权人 北京邮电大学;

    申请/专利号CN201810271027.2

  • 申请日2018-03-29

  • 分类号H04W28/08(20090101);H04W40/22(20090101);H04W84/18(20090101);

  • 代理机构

  • 代理人

  • 地址 100876 北京市海淀区西土城路10号

  • 入库时间 2023-06-19 07:00:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-19

    授权

    授权

  • 2018-12-07

    实质审查的生效 IPC(主分类):H04W28/08 申请日:20180329

    实质审查的生效

  • 2018-10-26

    公开

    公开

说明书

技术领域

本发明属于无线传感器网络技术领域,特别涉及基于随机自动学习机与模 糊算法的高吞吐量的继选择方法。

背景技术

在无线传感器网络中,无线传感器节点的资源非常有限,主要体现在能量、 存储能力、处理能力和通信宽带上。在一些场景中,如机器人搜救、无人机指 挥,传感器节点处于复杂的环境中,在源节点和目的节点直接距离远或者通信 链路质量差的情况下,采用直接传输的方式将使系统性能严重下降。合作通信 被证明是实现空间多样性和解决无线网络中日益增长的数据吞吐量需求的方 法。如何选择最佳中继,通过选择的中继进行多跳传输,进而提高网络的吞吐 量等性能指标,对无线传感器网络的研究具有深远的影响。

近年来,提出许多中继选择算法。例如提出的基于模型预测控制(MPC)的 方法,通过粒子群移动的算法来定位和控制中继节点的移动,通过简单的考虑 可用节点的数量来联合优化网络连接和吞吐量。另外,还有将遗传算法应用到 中继选择中。另外一种算法维护一个中继速率表,每次进行源节点到目标节点 的传输,要比较直接传输和潜在的协作传输之间速率,选出具有最快速率路径 进行传输。然而这种算法当链路质量下降时,通信性能将受到严重影响。在此 基础上,提出基于备份路径的辅助传输,来保证数据的可靠性,但这种方法采 用可用的潜在路径进行传输,不能选择使吞吐量最优的中继进行传输。

协调器端的通信,由媒体访问控制协议(MAC)提供周期性的监听/睡眠状 态,防止偷听和空闲监听。当前大多数的研究集中于解决传感器节点的能量消 耗问题。但这也导致了其他问题,传感器节点可以关闭其无线传输,但不能与 处于该状态的其他节点通信。如果传感器节点切换到侦听状态发送数据,则必 须等到其他节点也切换到侦听状态。如果其他节点具有不同的时间表,通信将 变得很困难。需要紧急传输的数据经常迟到,整个网络的吞吐量和无线传感网 的传输速率因此下降。此外,存在中继负载不均衡的情况,导致网络整体性能 下降。

发明内容

本发明实施例提供基于随机自动学习机与模糊算法的高吞吐量的继选择方 法。在运行期间,各个源节点具有自组织性,拥有自我优化和自学能力。运行 期内,无需与其他节点交换信息,通过环境反馈自适应选择中继,不需要人为 干预,以便最大化吞吐量,保证系统稳定运行。在中继与目的节点之间,通过 模糊算法达到负载均衡。

为达到上述目的,本发明实施例提供了基于随机自动学习机与模糊算法的 高吞吐量的继选择方法,随机自动学习机应用于无线传感器网络中的源传感器 节点所在设备上,模糊算法用于进行中继负载均衡,方法包括:

根据无线传感器网络环境进行模型建立,将传感器网络环境模型用四个参 数表示E={S,M,(Ai)i∈S,(Cj)j∈M},其中S表示源节点,即随机自动学习机的输入;>i代表可选动作,即选择了哪一个>j表示节点选择合适的中继之后与环境交互输出的反馈信号,本>

具体的,本发明属于合作通信模式,中继起到数据转发的功能。存在两种 中继转发方法,放大转发(AF)和解码转发(DF)。

在DF模式下,中继将接收到的源节点数据包进行解调,解码,然后再次 进行调制,编码以后,发送到目的节点。这种方法由于编码,解码以及调制解 调,使系统延时上升,传输速率下降。采用DF模式传输,系统吞吐量表示如 下:

在AF模式下,中继节点简单地放大从源节点接收到的信号并将其传输到 目标节点。这是一种简单的方法,并且可以低成本实施。采用AF模式传输, 系统吞吐量表示如下:

需要说明的是,对于合作传输,在特定的情况下,采用中继辅助传输系统 的吞吐量不总是比采用直接传输系统的吞吐量大。所以本系统存在直接传输和 AF传输两种传输方法。采用直接传输,系统的吞吐量如下:

CD(s,d)=Wlog2(1+SNRsd)(3)

节点生成特定帧结构格式,节点选择相应的动作。即选择特定中继进行传 输时,由于中继被共用,中继将采用时分多址的方式服务于各个源节点。一帧 内分为两个时隙,用于从源到中继,中继到目标节点的两跳传输。

源节点根据环境反馈获得自学能力,通过和环境的反复交互不断更新状 态,最终,找到最优中继进行传输。

具体的,为各个源节点初始化其动作集合,动作选择概率集合,反馈集合。 随机自动学习机是一个基于概率的学习工具,它通过随机动作概率向量Pik(t)来>

需要说明的是,该系统存在多个源节点去竞争一个中继进行传输的情况, 即存在竞争关系,网络建模为拥塞的非合作博弈,网络存在纳什均衡点。即系 统达到NE点以后,任何一个节点改变动作,都不会获得更大的效用。

需要说明的是,在初始阶段,设置迭代因子t=0,动作选择概率集合初始化 为这样可以保证初始时刻,源节点随机接入中继, 进行自动学习。

源节点使用随机学习自动机方法(SLA)方法与周围环境进行交互。

具体的,对于任意一个源节点i,初始化概率选择集合,节点通过该概率 向量选择相应的动作。选择的动作将作为随机自动学习机的输入。

随机自动学习机将评估该动作与环境交互后对数据传输的影响,输出相应 的效用函数,更新动作选择概率集合。

具体的,在时隙t开始时刻,源节点i根据其初始化的概率选择集合选择 一个动作,输入到随机自动学习机。随机自动学习机与环境进行交互,在时隙 t结束的时候,源节点i将会收到一个效用函数。依据此效用函数的反馈去更 新动作概率集合。

需要说明的是,随机自动学习机是一个不断迭代的过程。每个时隙结束以 后,完成一次迭代,更新各个源节点的概率选择集合。概率选择集合的更新按 照如下公式进行。其中,β取值代表一个步进值,取值范围是0到1,β取初 始值0.4,既能保证一定的学习速度,又不至于步进过大,错过最优动作。β用 于将各个源节点趋近于稳定的NE点。

Pik(t+1)=pik(t)+βri(t)(1-pik(t)),k=ai(t)(4)

Pik(t+1)=pik(t)-βri(t)pik(t),k≠ai(t)>

随着t不断的增大,学习不断进行,概率选择概率集合趋向于集中化。此 时应当调整β使其变小,由此可以在小范围内进行继续的学习探索。β和迭代 次数存在关联,本发明中,将β定义如下:

本发明中,ri(t)代表环境奖励。源节点选择一个动作以后,会收到环境反>o(i),然后源节点再选择另外一个动作与环境交互,得到最>n(i),定义Δu为效用函数的差值。当Δu增大时,ri(t)取值+1,>

源节点接有不同传感器,本发明考虑实际应用中,传感器不同节点发送数 据的紧急情况有所不同。本发明在中继节点转发源节点数据到目的节点时,考 虑数据发送的差异,故而本发明中存在不同优先级的数据以及不同的优先队 列,用于对不同优先级数据的传输。

具体的,具有高优先级的数据比低优先级的数据拥有更多的传输机会。本 发明中存在三种不同优先级的数据,优先级为1、2、3代表的优先级依次升高。 优先级为1的数据在一帧内有一次数据接入信道,发送到目的节点的机会。优 先级为2的数据在一帧内有两次机会。优先级为3的数据有4次数据传输机会。

相应的,存在三种级别的优先级队列。中继节点将高优先级的数据放入高 优先级队列中,将低优先级数据放入低优先级队列。因此,高优先级的数据有 机会在任何时间内发送。具体的发送方案见图5。

本发明中,不失一般性的,假设中继节点到目的节点的数据链路信道衰落 模型为瑞利衰落。瞬时信噪比的密度函数定义如下:

上式中,代表中继节点到目的节点的平均信噪比。根据瞬时信噪比的 标准定义,i链路信噪比大于j链路信噪比的概率定义如下:

对于M个中继节点,中继节点i被选做最优中继,只有当中继i到目的节 点的瞬时信噪比大于其他M-1条链路,因此,中继节点i被选择的概率为:

由于不同链路有不同的信道条件,信道条件好的链路被选择的概率大,负 载严重,不利于平衡传输,本发明中采用模糊算法平衡负载。

具体的,模糊系统的设计包含定义的输入信号和隶属函数,隶属函数用于 量化模糊集输入值的隶属度。模糊系统的每个输出都对应一个标签。本系统 中,”FIR_CH”,”SEC_CH”,”TH_CH”,”NO_CH”被用作模糊输出的标签。不 同隶属函数可以确定输入空间中不同的粒度,同时保持少量状态减少控制规则 的大小。

系统存在两种模糊集,SNR模糊集和负载模糊集。将SNR模糊集分别定 义为相对高集(RH),高集(H)和非常高(VH)集。SNR模糊集的隶属函数 定义如下:

本发明中,负载模糊集定义为系统正在使用的信道数与中继当前可用最大 信道数之间的比率。负载模糊集的隶属函数定义如下:

其中,Ai和Bi都是隶属函数的参数。一组模糊规则是模糊系统的核心部 分,也是计算输入值输出的关键。规则遵循IF-THEN类型的语言句法来设置 控制策略。为了平衡中继的负载,我们提出的方案中的模糊规则概述如下:

1IF(SNR is“VH”)AND(LOAD is“L”)THEN(Output is“FIR_CH”)

2IF(SNR is“RH”)AND(LOAD is“H”)THEN(Output is“NO_CH”)

3IF(SNR is“VH”)AND(LOAD is“H”)THEN(Output is“NO_CH”)

4IF(SNR is“H”)AND(LOAD is“L”)THEN(Output“SEC_CH”)

5IF(SNR is“H”)AND(LOAD is“M”)THEN(Output is“SEC_CH”)

6IF(SNR is“H”)AND(LOAD is“H”)THEN(Output is“NO_CH”)

7IF(SNR is“RH”)AND(LOAD is“L”)THEN(Output is“TH_CH”)

8IF(SNR is“RH”)AND(LOAD is“M”)THEN(Output is“TH_CH”)

9IF(SNR is“RH”)AND(LOAD is“H”)THEN(Output is“NO_CH”)

考虑瞬时信噪比SNR=α,LOAD=β定义

Ωi(i=1,2,3,4)分别代表模糊集合的输出FIR_CH、SEC_CH、TH_CH、NO_CH。

利用信噪比SNR和负载两个输入集,通过各个中继的输出,选取FIR_CH、 SEC_CH、TH_CH、NO_CH的最大者,不至于出现一个信道条件好的中继负载 严重的情况。

为达到上述目的,本发明实施例提供了一种高吞吐量的中继选择装置,应 用于无线传感器网络中的源传感器节点,所述装置包括:

发送单元,各个源节点根据自身的情况设置生成的帧格式,发送给中继节 点或者直接发送给目的节点;

中继单元,在本系统中,用于进行辅助传输。中继单元用于接收各个源节 点发送的数据帧,对数据帧进行放大转发;

接收单元,用于接收各个源节点发送的数据帧;所述数据帧至少包括节点 id、数据体、奇偶校验位等参数;

评估单元,根据传感器节点的效用函数以及协调的工作状态评估该动作的 选择概率,更新动作概率集合;

自主学习单元,节点采用随机学习自动机方法更新自身的动作集合,动作 选择概率集合以及反馈的效用函数;

自适应调节单元,选择动作之后,基于学习次数调整参数β,完成快速中 继选择。

模糊单元,通过模糊算法对中继进行负载均衡,完整数据平稳传输。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于随机自动学习机的高吞吐量的继选择 方法的流程示意图;

图2为本发明实施例提供的学习自动机的模型示意图;

图3为本发明实施例提供的时分多址接入源节点的结构示意图;

图4为本发明实施例提供的一种高吞吐量中继选择装置的结构示意图。

图5为本发明实施例提供的目的节点采用优先级区别的方式接收发送 节点数据的结构示意图。

图6为本发明中中继接收到的数据优先级说明。其中,优先级为3的 数据优先级最高,一帧内有4次接入信道的机会。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

依据附图,对本发明的技术方案作具体说明。

所述的基于随机自动学习机与模糊算法的高吞吐量的继选择方法,包括以 下步骤:

S101,对无线传感器网络进行模型建立。具体的,根据无线传感器网络环 境进行模型建立,将传感器网络环境模型用四个参数表示 E={S,M,(Ai)i∈S,(Cj)j∈M},其中S表示源节点,即随机自动学习机的输入;M代表>i代表可选动作,即可备选的中继;Cj表示节点选择合适的中>

需要说明的是,随机自动学习机是一个不断迭代的过程。每个时隙结束以 后,完成一次迭代,更新各个源节点的动作集合、概率选择集合、效用函数集 合。

S102,节点生成特定帧结构格式,然后进行发送。本发明中采用中继转发 的方式提高系统传输速率。一帧可以分为两个时隙,在时隙1中,源节点将数 据传输到中继节点。在时隙2中,中继将数据放大转发,发送到目的节点。特 别的,本发明中,中继节点的数据少于源节点的数据。网络正常运行时,存在 源节点竞争中继的情况。中继节点将采用时分多址的轮询方式服务于各个接入 的源节点。每两帧时间结束以后,服务于下一个源节点,具体见图3。

S103,为各个源节点初始化其动作集合,动作选择概率集合以及回馈集合。

具体的,随机自动学习机是一个基于概率的学习工具,它通过随机活动概 率向量Pi(t)来选择动作,动作概率向量是学习自动机的主要构件,所以必须保>i的动作概率向量表示如下:

其中,Pi(t)表示在时刻t,节点ai选择某一动作的概率。

需要说明的是,在初始阶段,为了保证源节点随机接入中继,将概率向量 集合初始化为:

其中t是迭代因子,代表一次迭代。i代表任意一个源节点。k代表动作, 即选择哪一个中继。M+1代表可选动作总数。

效用函数代表各个源节点选择动作以后,环境给出的反馈。效用函数初始 化如下:

S104,源节点使用随机自动学习机方法(SLA)方法与周围环境进行交互。 自动学习机属于强化学习的一种手段。每个源节点根据环境反馈获得自学习能 力以找到合适的中继节点。源节点之间无需交换信息,具有自组织性和自我优 化能力。

随机自动学习机模型可以由三维数组SLA=(a,u,p)表示,其中, a={a1,a2,...,ar}表示学习随机自动机的输入动作集;u={u1,u2,...,ur}表示效用函数>1,p2,...,pr}表示概率动作选择集合,满足其中pi(t)表示经过第t轮学习以后ai对应的动作概率。

S105,特定时隙内,节点根据概率选择集合选择相应的动作。具体来讲, 概率选择集合处于不断的更新之中。源节点每选择一个动作与环境进行交互, 都会接收到环境的一个效用反馈。以此反馈作为概率更新的依据。概率更新完

S106,反馈与更新。在随机自动学习机模型中,SLA=(a,u,p)。p代表概 率动作选择集合。t次迭代结束以后,将收到环境的反馈,在本发明中代表源 节点收到的效用函数ui(t)。

S107,协调器采集各个中继节点发送过来的数据。考虑接收到的数据发送 到目的节点的紧急程度不同。本发明中,中继节点中接收到的数据将采用不同 的优先级进行传输,需要快速接入信道的数据,将存放于高优先级队列中等待 发送;不需要快速接入信道的数据,将存放于低优先级队列中等待发送。采用 优先级区分的方式,数据传输更加合理。

本发明中,考虑可能存在不同中继信道条件差别很大的情况。根据SNR 数据集与负载数据集作为模糊算法的输入,可以实现中继与目的节点间数据传 输的负载均衡,达到稳定传输的目的。

本发明假设无线传感器网络为星型拓扑结构,协调器收集终端设备发送 的数据。事例性的,每个中继节点接收到的数据存在三种优先级的数据L0、 L1、L2需要向协调器发送。数据L0、L1、L2对应的优先级分别为1、2、3。 优先级为3的数据,将放入最高级别的优先队列中,在一帧内有4次接入信 道的机会,接入信道并成功发送数据以后,在该帧时间内,将不再进行信道 竞争。同样的,将优先级为2的数据放入次级优先队列中,在一帧内有2次接入信道的机会,接入成功后,将不再竞争信道资源;而无论信息是否成功 发送,优先级为1的节点一帧内只有一次接入信道的机会。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号