首页> 中国专利> 多跳蜂窝网络架构中对于环境感知的信息中心化资源管理方法

多跳蜂窝网络架构中对于环境感知的信息中心化资源管理方法

摘要

多跳蜂窝网络架构中对于环境感知的信息中心化资源管理方法,本发明涉及一种无线环境感知网络,并且在信息中心化和多跳蜂窝网络中提出了新的结构。引入了网络中的缓存和在路由中的进程于网络中来减少通信量。考虑到信息包的优先级、延迟、大小和在无线链路中的瑞丽衰减,提出了最优的资源管理办法,来最小化长期的能量消耗。这个最优化的问题被建模成了一个带限的无休止赌博机问题,并且进一步的将其再建模为了一个标准的无休止赌博机模型,它的可检索特征帮助减少了在线算法的复杂度。该发明显著的提升了环境感知网络的性能。

著录项

  • 公开/公告号CN104954176A

    专利类型发明专利

  • 公开/公告日2015-09-30

    原文格式PDF

  • 申请/专利权人 北京工业大学;

    申请/专利号CN201510280750.3

  • 申请日2015-05-27

  • 分类号H04L12/24(20060101);

  • 代理机构11203 北京思海天达知识产权代理有限公司;

  • 代理人沈波

  • 地址 100124 北京市朝阳区平乐园100号

  • 入库时间 2023-12-18 11:14:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-09

    未缴年费专利权终止 IPC(主分类):H04L12/24 专利号:ZL2015102807503 申请日:20150527 授权公告日:20190322

    专利权的终止

  • 2019-03-22

    授权

    授权

  • 2015-11-04

    实质审查的生效 IPC(主分类):H04L12/24 申请日:20150527

    实质审查的生效

  • 2015-09-30

    公开

    公开

说明书

技术领域

本发明涉及一种无线环境感知网络,提出了更好的无线环境感知网络中的资源管理办法, 属于无线通信中信息中心化和资源管理相关领域。

技术背景

由于在很多国家和地方环境污染问题变得日益严重,环境感知网络近来吸引了非常多的 注意。环境感知在提升人类的舒适度、健康和安全上扮演着重要的保护角色。空气中的一氧 化碳、二氧化碳、二氧化硫和有机混合物,海水的导电性、温度和压力,需要持续的感知和 监测,所以有效的信息可以被整合起来依靠大数据和云计算的方法来进行分析。

无线传感器网络是在收集环境信息中使用最为广泛的方法。自从传感器广泛成为了具有 能量支持限制的小型设备,多跳信息传输方式就被用在了无线传感器网络中来传输数据到远 距离的信息接收出和因特网网关。在那些分布式的无线传感器网络中,例如路由和介质访问 控制模型等的关键技术已经被很好的研究了。

除此之外,在近期脱颖而出的用于无线传感器网络中的信息中心化的新概念,可以依靠 将传感器作为传送路由器在网络中缓存前期数据来减少信息发送的延迟。由于环境测量值不 会经常性的显著改变,所以许多信息包将包含非常多相似的信息,基于这样的情况,信息中 心化的新概念可能会非常的有效。

另一方面,无线电资源管理在无线网络中一直是非常重要的关键问题。特别是无线电通 信中的频谱资源,更加的稀少和珍贵。然而,众所周知,稀少的频谱资源正在使用殆尽。多 样化的无线电管理模式已经在多种多样的应用中被提出了,而在环境感知网络中如何高效的 利用有限的无线电资源来进行数据传输,同样是相当重要的。

无休止赌博机(Restless Bandits)是研究一系列随机序贯决策问题的理论。指在一系列离散 的或连续的时刻点上做出决策,系统将获得与所处状态和所采取决策有关的回报,并影响系 统在下一个决策时刻点所处的状态,并以此影响未来的最终受益。它可以通过每个项目的优 先权索引值(priority-index)解决,索引值可以通过线性规划放宽(Linear Programming  Relaxation)和原始双重索引探索法(Primal-dual Index Heuristic)求得。优先权索引值能在离线 (off-line)状态计算并存储在索引表(index table)中,因而能显著的降低在线(on-line)运算量和 实施复杂度。

发明内容

本发明提出了一个对于环境感知的信息中心化多跳蜂窝网络架构,在这个网络架构中, 为了减少网络流量,信息包经过预处理缓存在路由器中。进一步,依靠分配给无线链路的物 理资源模块,提出了一个动态的无线电资源管理框架,来最小化全方面长期的能源消耗,和 考虑无线信道的状态一样,考虑信息包的优先级,大小,延迟等方面。资源管理最优化问题 可以建模为有限制的无休止赌博机模型,为了高效的解决问题,可以再建模为无休止赌博机 模型。

为实现上述目的,本发明采用的技术方案为一种多跳蜂窝网络架构中对于环境感知的信 息中心化资源管理方法,包括以下步骤:

步骤1:构建系统模型,即无线环境感知网络抽象模型。

在IC-MEN中,测量空气和水质量的环境传感器,在其他传感器当中,是通过多跳蜂窝 网络连接的,在多跳蜂窝网络中有一个基站是负责处理传感器和在其覆盖范围内的链路的, 并且传感数据被发送到基站通过多跳无线网络,或者无线mesh网络。传感器不仅仅是数据收 集者,也是和每一个路由器配合的路由器,来传递环境感知信息到基站。基站被安装了高功 率发射器,但是传感器接收功率受到电池大小和花费的限制。所有的传感器能够接收到基站 的广播信号,但是基站不能感知到传感器的信号,除了那些距离足够近的可以成功一次跳转 就连接到基站的。

步骤1.1:环境感知系统抽象模型

基站被安装了高功率发射器,所有的传感器能够接收到基站的广播信号,但是基站不能 感知到传感器的信号,除了那些距离足够近的可以成功一次跳转就连接到基站的。网络中的 缓存器,缓存了上载环境信息的,安装在了每一个传感器上。

步骤1.2:无线信道模型

衰落是在无线通信中一个非常大的挑战。考虑块衰落信道,意味着在一个时隙里的的信 道增益变化可以忽略不计,但是在不同时隙间的变化需要被考虑。由于环境感知网络中通信 量通常是很低的,导致了相关的窄频带是很充足的,所以忽略在无线信道中的频率选择影响。

步骤1.3:网络中缓存模型

其中一个做出主要贡献的信息中心化网络概念在网络中缓存里介绍了。在提出的网络中, 在网络中的缓存,或者短期缓存,在每一个传感器上被安装了。在收集了环境信息以后,传 感器将新的数据和缓存的数据进行比较,并且产生一个仅包含不同的数据包。然后新的数据 被传感器缓存,重置已经过期的旧数据。由于环境不总是剧烈并且快速的变化,数据包的大 小可以小于一个包含着原始收集数据的数据大小。

步骤1.4:服务模型

大部分的环境数据是常规的环境质量报告。然而,任何紧急的事情,例如:毒气泄漏, 或者游轮事故,需要即使的监测来迅速的做出反应。所以在IC-MEN中考虑两种类型的数据 包,低优先级的常规数据包和高优先级的紧急数据包。无论什么时候一个紧急的数据包到达 路由器,它在发送队列中的位置要在所有常规数据包前面。

步骤1.5:能量模型

能耗一直是在设计无线网络中一个非常关键的因素,特别是在相对来说电池容量较低的 传感器的无线环境感知网络中。

步骤2:将资源管理模型构建为无休止赌博机模型。

步骤2.1:建立系统空间状态。

在提出的资源分配架构中,每一个链路被作为一个目标来控制。队列状态应该被作为目 标状态,基于物理资源模块的决定已经分配好了。

步骤2.2:建立行为和策略。

在每一个决定的tk时间点,做出决定并且来非配C物力资源模块到L链路。让a(l,k)定义 链路l在tk时间点的行为。

步骤2.3:计算一步转移概率。

(1)离散信道状态转移:信道状态可以被考虑为一个马尔科夫随机过程。

(2)a(l,k)=0的包的状态转移:三个下层状态,h(l,k),y(l,k)和g(l,k)定义了 大小,类型和链路l发射队列里第一个包的延迟。当a(l,k)=0时,没有物理资源模块被分 配到了链路,所以包的状态可能改变仅当第一个包的延迟过高和它需要被丢弃。

(3)a(l,k)=1的包状态转移:当a(l,k)=1的时候,包的大小将变化及时即使,因为第一个包可能使用分配物理资源包进行转移。

(4)系统转移状态:由于信道状态z(l,k)是独立于其他下层状态的。

步骤2.4:建立能量消耗模型。

一个传感器总是努力最小化在一个时隙中传输包的能量。假设一个时隙的长度为τt。于 是在τt间完成一个大小为h(l,k)的包。

步骤2.5:建立系统奖励模型。

提出的资源管理架构目标是最小化对于带限的不同类型的包的能量消耗。所以使用 作为系统在[tk,tk+1)时间内在链路l上传输获得的奖励,当a(l,k)=1和包的传 输延迟被接受的时候。这里是一个在一个时隙中最大能量的消耗的持久代表。

步骤3:构建最优化资源管理模型。

需要重新构造以上带限的restless bandits问题为一个标准的restless bandits问题来利用已 知的算法。为了处理在RB-C公式中的限制,引入了惩罚因子V,V被定义为在系统不满意限 制的时候的开销。根据的情况,使用Vg(l,k)来代表不同类型的包的状态的惩罚因子。

步骤3.1:将最优化资源管理构建为无休止赌博机模型。

为了减少算法的复杂度,一个随机的restless bandits分步式算法可以使用,利用在最优的 原始的对偶解决方案中信息于一阶的松弛模型中。对于所有可用的状态的指标可以在线下进 行计算,而上线时,对象决定他们的指标根据当前的系统状态,并且互相分享。具有最低指 标的对象将被选择。

附图说明

图1为无线环境感知网络示意图;

图2为本发明所涉及的方法流程图;

图3为不同数量传感器下的平均传输功率曲线;

图4为不同数量物理资源模块下的平均传输功率曲线。

图5为不同数量传感器下的平均包延迟曲线;

图6为不同数量物理资源模块下的平均包延迟曲线;

图7为不同数量传感器下的丢包率曲线;

图8为不同数量物理资源模块下的丢包率曲线;

图9为不同数量传感器下的系统收益曲线;

图10为不同数量物理资源模块下的系统收益曲线;

具体实施方式

下面结合附图和实施例对本发明做进一步说明。

无线环境感知网络示意图如图1所示。本发明所述方法的流程图如图1所示,包括以下 步骤:

步骤1:构建系统模型

步骤1.1:环境感知系统抽象模型

基站被安装了高功率发射器,所有的传感器能够接收到基站的广播信号,但是基站不能 感知到传感器的信号,除了那些距离足够近的可以成功一次跳转就连接到基站的。网络中的 缓存器,缓存了上载环境信息的,安装在了每一个传感器上。假设有N个传感器,一个基站 和L个无线链路连接所有的传感器到基站。L≤((N+1)/2),并且通常是,L<<((N+1)/2)。

步骤1.2:无线信道模型

瑞丽信道模型,概率密度公式为:

f(x)=xk2e-x22k2,---(1)

正态公式是

F(x)=1-e-x22k2,---(2)

式中,x为信道响应的包络,相关的均差和方差是和信道响应的包络(信 道状态)x是一个随机过程,使用x(l,t)来定义在时间点tk链路l的状态。接收器被装备了信 道估计模型,所以x(l,t)能够在tk被观察到。

步骤1.3:网络中缓存模型

让h(l,k)代表在tk时间点链路l的发送器队列中的第一个数据包,是所有链路集 合。用来定义集合的大小。h(l,k)是一个随机过程。

步骤1.4:服务模型

y(l,k)被用来定义在tk时间l发送器发送队列中的第一个数据包的类型,y(l,k)=1代 表紧急包,y(l,k)=2代表常规的数据包。使用来定义在tk时间点由l发送的紧 急数据包的紧急事件持续时间τe(l,k)的概率分布公式。进一步,将链路l的发送器的第一个 数据包的延迟构造成离散的随机过程模型,定义为g(l,k)。g(l,k)的实现其实就是自从它 一产生数据包在传输的道路上所用的时隙的数量。

步骤1.5:能量模型

接收功率qR=qTx2,qT是发射功率。信号传播损耗方程:

qR(l)=qTMTMRγP,---(3)

是接收信号功率的平均值,MT和MR是相关的传输和接收天线的增益,γP是传播损 耗,可以被写成:

γP=(4πα(l)λ)2,---(4)

α(l)是链路l的长度,λ是波长。

qT[(4-π)k22+(kπ2)2]=qTMTMRγP,---(5)

k=MTMR/γP.

步骤2:将资源管理模型构建为无休止赌博机模型

步骤2.1:系统空间状态

把提出的问题公式化为一个马尔科夫决定过程,需要用离散的状态z代替连续的x。

0≤i≤Z-1是z的实现,∈1,1≤i≤Z-1是域限。

系统的状态是一个组:

s(l,k)=[g(l,k),y(l,k),h(l,k),z(l,k)],  (7)

让定义为s(l,k)的实现,为系统状态空间,是所有可用的的实现的集合。

相似的,用和来定义g(l,k),y(l,k),h(l,k)和z(l,k)的实现,相关的, 和是以G,Y,H和Z作为和的大小,的大小被写成

步骤2.2:行为和策略

在每一个决定的tk时间点,做出决定并且来非配C物力资源模块到L链路。让a(l,k)定义 链路l在tk时间点的行为,

自从有仅仅C PRBs被分配到了L链路,并且C<L,有

称a(l,k)=1的链路为积极的目标,a(l,k)=0的为消极目标。

策略A被定义为从时间点t1到tk的动作集合,例如:A={a(l,k)}k={1,2,…,K}。用来定义 所有的策略的集合。最优的策略A*是能让系统的目标达到最优化的策略。

步骤2.3:一步转移概率

1)离散信道状态转移:信道状态可以被考虑为一个马尔科夫随机过程。根据公式(2), 到的转移概率是

PZ(i,j)是的缩写,显然,z(l,k)是独立于a(l,k), h(l,k),y(l,k)和g(l,k)。

2)a(l,k)=0的包的状态转移:三个下层状态,h(l,k),y(l,k)和g(l,k)定义了大小, 类型和链路l发射队列里第一个包的延迟。当a(l,k)=0时,没有物理资源模块被分配到了链 路,所以包的状态可能改变仅当第一个包的延迟过高和它需要被丢弃。因此,将联合转移概 率y(l,k)和g(l,k)设为:

Py,g0(i,j)=P(y(l,k+1))=y~j,g(i,k+1)=g~j|a(l,k)=0,y(l,k)=y~i,g(l,k)=g~i)=[1-Py,1+Py,1+Py,1]Pg,1(g~j),ify~j=y~i=1,gi=g^y~,Py,1(1-Py,1)Pg,2(g~j),ify~j=2,y~i=1,gi=g^y~,Py,1Pg,1(g~j),ify~j=1,y~i=2,gi=g^y~,(1-Py,1)Pg,2(g~j),ify~j=y~i=2,gi=g^y~,Pg,y~j(g~j),ify~j=y~i,gi<g^y~0,ify~j=y~i,gi<g^y~,,---(11)

是可以接受的类型包的最大延迟(在几个时隙间),是在一个时隙里紧急事件的 概率,类型包的延迟的分布概率,是一紧急包在队列既是第一个包也是最后一 个包的概率。

是向下取整函数。

a(l,k)=0,y(l,k)=y~i,g(l,k)=g~i作为条件,h(l,k)的转移概率为

Ph|y,g0(i,j)=P(h(l,k+1))=h~j,|a(l,k)=0,h(l,k)=h~i,y(l,k+1)=y~j,g(l,k+1)=g~j,y(l,k)=y~i,g(l,k)=g~i)=Ph,ifgi=g^y~,1,ifh~j=hi,gi<g^y~,0,ifh~jhi,gi<g^y~,,---(13)

是分布概率的包的大小。

3)a(l,k)=1的包状态转移:当a(l,k)=1的时候,包的大小将变化及时即使,因为第一个包可能使用分配物理资源包进行转移。相似的,

Py,g1(i,j)=P(y(l,k+1))=y~j,g(i,k+1)=g~j|a(l,k)=1,y(l,k)=y~i,g(l,k)=g~i)=[1-Py,1+Py1,Py,1]Pg,1(g~j),ify~j=y~i=1,Py,1(1-Py,1)Pg,2(g~j),ify~j=2,y~i=1,Py,1Pg,1(g~j),ify~j=1,y~i=2,(1-Py,1)Pg,2(g~j),ify~j=y~i=2,---(14)

并且

Ph|y,g1(i,j)=P(h(l,k+1))=h~j,|a(l,k)=1,h(l,k)=h~i,y(l,k+1)=y~j,g(l,k+1)=g~j,y(l,k)=y~i,g(l,k)=g~i)=Ph---(15)

4)系统转移状态:由于信道状态z(l,k)是独立于其他下层状态的,s(l,k)转移概率可以 被写成

Psa(i,j)=Pzi,jPh,y,ga(i,j),---(16)

是h(l,k),y(l,k)和g(l,k)的联合转移概率。

Ph,y,ga(i,j)=P(h(l,k+1))=h~j,y(l,k+1)=y~j,g(l,k+1)=g~j|a(l,k)=1,h(l,k)=h~i,y(l,k)=y~i,g(l,k)=g~i)=Ph|y,ga(i,j)Py,ga(i,j).---(17)

步骤2.4:能量消耗

一个传感器总是努力最小化在一个时隙中传输包的能量。定义一个时隙的长度为τt。于 是在τt间完成一个大小为h(l,k)的包,最小化的能量消耗为

et*(l,k)=min0etq^tτtet,

s.t.,h(l,k)Wlog(1+qR(l,k)σ2)τt,---(18)

是最小化的功率,所以是最大化的传输能量在一个时隙间。

最优化的的来源是线性的,

et*(l,k)=2τtσ2(2h(l,k)τtW-1)x(l,k)2,---(19)

既决定于x(l,k)也决定于h(l,k)。

传感器即使不发送也要消耗能量,用来对环境进行感知、数据处理、信号收集等等。e′定 义为在一个时隙里期望的能量消耗加之传输信号所消耗的能量,于是在[tk,tk+1)在l的总能量 消耗是

e(l,k)=et*(l,k)+e.---(20)

步骤2.5:系统奖励

提出的资源管理架构目标是最小化对于带限的不同类型的包的能量消耗。所以使用 作为系统在[tk,tk+1)时间内在链路l上传输获得的奖励,当a(l,k)=1和包的传 输延迟被接受的时候。这里是一个在一个时隙中最大能量的消耗的持久代表。奖励Ra(l,k) 可以被写为

并且所有的系统奖励为公式化为

β是折扣因子。

于是最优的资源管理问题被写为

步骤3:最优化资源管理模型

步骤3.1:将最优化资源管理构建为无休止赌博机模型

引入惩罚因子V,V被定义为在系统不满意限制的时候的开销。根据情况,使用Vg(l,k)来 代表不同类型的包的状态的惩罚因子。结果是,在RB-C问题中的系统奖励被更新为

Vg(l,k)通常在问题中被设定为一个大的正数。

系统的状态s(l,k),行为a(l,k),一步转移概率不需要重新调整。

下面结合仿真实验结果对不同数量传感器和物理资源模块系统的各项性能进行分析比较。

假设N=20,20个传感器随机的分布在1km×1km的区域中,一个基站作为一接收器放置 在区域的中央。有C=16个的物理资源模块同时对于无线链路可用。时隙的长度τt=0.01ms。 一个紧急和常规的数据包的最大可接受延迟为时隙和相关的,超过和的丢包开销为V1=100和V2=20。在一个时隙紧急事件发生的概率设定为0.02。传感器的 发射功率自动的调整在0.5mW和2.5mW之间。

1.功率消耗

在图2中,显示了在数量不同的传感器网络中,对于每一个传感器的平均传输功率。随着 网络中传感器数量的增加和确定数量的可用的物理资源模块,平均功率因为更多的链路不能 获得充足的无线电资源来传输而随之下降并且消耗了零功率。如图中所示,提出的架构显著 的减少了平均功率消耗,对于传感器的数量从12到32。并且最大化的紧急包和的可接受 延迟不会过多影响性能。

在图3中,显示了不同的物理资源模块数量下平均传输功率的消耗。随着物理资源模块数 量的增加,平均功率因为更多的传感器有了机会发送信息而增加。少数量的物理资源模块, 例如C=4时,由于提出的架构的功率消耗和现存的架构是相似的,最优的资源管理算法努力 分配物理资源模块到有紧急包和大延迟包的链路上,替代需要较低功率的链路。

2.包延迟

在图4和5中,也比较了平均的包延迟的性能,来发现传感器数量和物理资源模块数量对 于延迟所带来的影响。

对于在网络中不同的传感器数量,所提出的架构和现存的忽略最优管理办法的算法比较 起来总是性能更好。延迟增加的包被丢掉,平均延迟当的时候远远低于(注 意并且在图中比较的是平均延迟)。

如在图5中观察到的,当在网络中拥有更多的物理资源模块时,包的延迟性能可以得到提 升。在这种情况下,提出的架构显著的超越的已存算法的性能。

3.丢包率

包会被丢掉当他们为了紧急包而延迟增加和常规包增加的时候,因为这些包已经过 时了并且需要被新的环境数据代替。在图6和7中比较了丢包率。两张图都显示所提出的架构 几乎可以保证没有包因为他们的延迟被丢掉(最坏的情况丢包率也仅为0.3%)。但是已经存 在的算法的丢包率在不同情况下从1%到18%变化。紧急包的丢包率因为而高于常规包。

4.系统奖励

提出的架构中系统奖励的性能在图8和9中显示了。因为现存的架构不能定义一个系统的 奖励,所以忽略和已存架构的比较。

在图8中,随着网络中传感器数量的增加,系统奖励减少主要因为丢掉过度延迟的包的概 率随着网络中通信量的增加而增加。的奖励低于的奖励因为最优架构不得不规 划物理资源模块来用到高延迟的包上,用于减少丢包率。

随着物理资源模块的增加,系统也同样增大,如在图9中显示的。更多的紧急包存在于系 统中导致了需要付出更多来处理它们,显著的影响了系统奖励。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号