首页> 中国专利> 基于博弈理论归一化的慷慨动态路由选择方法

基于博弈理论归一化的慷慨动态路由选择方法

摘要

一种基于博弈理论归一化的慷慨动态路由选择方法,包括利用车联网中的车载导航平台,当源节点产生一个需要传送到目的节点的数据包后,通过路由发现和路由维护来进行路由选择,所述路由发现中,源节点存储多条可将数据包传送给目的节点的路径,并选择信誉度最高的节点作为下一跳节点。本发明可有效的隔离不协作的自私车辆节点,有效降低了自私行为的影响;使用更加慷慨的博弈方法,减少了对协作车辆的误判;路由缓存器存储多条路由路径来达到更稳定的路由,能够适应车联网的移动性和信息拥塞的情况。

著录项

  • 公开/公告号CN104219148A

    专利类型发明专利

  • 公开/公告日2014-12-17

    原文格式PDF

  • 申请/专利权人 四川大学;

    申请/专利号CN201410500000.8

  • 发明设计人 王俊峰;李晓慧;

    申请日2014-09-25

  • 分类号H04L12/725;

  • 代理机构成都信博专利代理有限责任公司;

  • 代理人卓仲阳

  • 地址 610065 四川省成都市武侯区一环路南一段24号

  • 入库时间 2023-12-17 03:22:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-23

    授权

    授权

  • 2015-01-07

    实质审查的生效 IPC(主分类):H04L12/725 申请日:20140925

    实质审查的生效

  • 2014-12-17

    公开

    公开

说明书

技术领域

本发明涉及车联网中无线节点路由选择技术领域,具体为一种基于博弈理论归一化的慷 慨动态路由选择方法。

背景技术

随着车联网技术的发展和道路安全问题的不断深入,系统整体的整合以及车与车等的之 间的协同交互趋势日渐明显。然而,当车辆被购买后,一部分应用按照车主的意愿或者为了 个人隐私被任意修改,导致车联网内部存在自私行为。

车联网中,车辆传感器节点被划分为两种类型:协作节点和不协作节点。协作节点有能 力完成网络已部署给他的所有的相关工作,为车联网整体做出贡献。不协作节点指那些不能 够完成网络部署给他的工作的节点。不协作节点又被分为两部分,一类是为达到自身目的来 窃取他人信息的恶意节点,此类节点会不惜代价来对整个车联网造成伤害;另一类是只收所 需要的数据包面不为其它节点发送或转发消息的自私节点,由于自私节点总是很多信息的接 收节点,因此是不能从车联网中排除的。但是自私节点的存在是具有合理性的,因为他们自 私但不具有恶意性,这说明自私节点的目的是最大化他们自身的收益同时最小化支出或对全 网根本不贡献任何资源,因此收益为其获得的收益减去他们花费的成本。

因此,良好的节点活跃性能能够确保网络连通性的优势,同时更准确的体现的车联网的 核心,即互联协作。尽管在其它类似的无线网络中已经有很多研究用于解决协作问题,如无 线传感器网络(Wireless Sensor Networks,WSNs)和移动自组织网络(Mobile Ad hoc network, MANET),但这些方法都不能很好的满足车联网特有的特点。

首先,一些传统常用的使用激励机制的协作方法通过提供更多的服务作为奖励,这类方 法对车联网来说有很多弊端。一些恶意的节点为了获取更多的奖励制度和资源伪装成协作节 点发送很多恶意信息。同时这些错误并且无用的恶意信息会导致流量拥塞的爆炸式产生。因 此,综合考虑车辆隐私和自私行为,提出一种有效的提供最小量的资源并且不通过提供除外 的服务作为奖励,以隔离不协作节点的方法是至关重要的。博弈理论中经典的消除节点自私 动机以及产生博弈均衡的均衡边界条件有TFT(Tit For Tat,针锋相对策略)策略,是一个 用于重复囚徒困境的有效策略。该策略步骤为从博弈协作开始响应请求后,每次下一时间段 都选择对方前一阶段的行为。即若对手上一时间段不响应请求,下一时间段也选择背叛;若 对手上一时间段响应请求,则下时间段同样选择合作。但车联网的快速移动性不能很好的对 数据包进行监听。

其次,由于车联网报文受到车辆移动、信息冲突及其他干扰原因,数据包的发送和转发 不能被有效的监听到。自私节点的形成很可能是由于错误的判断,从而使已经拥有较差连通 性的车联网中的协作节点不能及时获得信息。事实上,对实际数据值的检测是不太可能的。 博弈理论中带有慷慨因子的GTFT(Generous Tit For Tat,慷慨的针锋相对策略)策略,在 处理对手上一时间段的不响应行为时,策略中提供了慷慨因子来使博弈达更有效的协作状态。 需要一种基于GTFT策略的慷慨因子同时依据车联网中数据包的实际收发情况提出一种更适 合车联网的协作性协议。

最后,能量约束问题在传感器网络中的一个显著的问题,能量使用应该是明智谨慎地。 协作问题在传感器网络中运用包括能量控制和节能方面。事实上,未来的电动汽车(Electric Vehicles,EVs)都配有大容量的电池,所以不再像传感器网络一样受能量的约束。车联网中 的电动汽车不再仅仅只是一个微小的传感器节点,他们拥有足够的能量,因此,缓冲区容量 问题将不再是一个要考虑的重要因素。此外,在路由通信时,车联网中的节点常常有大量的 下一跳节点需要进行选择,为了达到缓冲区和资源的高效利用率,可以考虑缓存多路径。同 时,当一个协作节点被大量邻居节点同时选择为下一跳节点时,所造成的拥塞会引起数据包 的丢失。因此,提出一个更加稳定的路由协议显得尤为关键。

发明内容

针对上述问题,本发明的目的在于提供一种不考虑能量约束,面向协作节点与没有恶意 性的自私节点,且能够适应车联网快速移动的特性的更加稳定的路由选择方法,一种基于博 弈理论归一化的慷慨动态路由选择方法,技术方案如下:

一种基于博弈理论归一化的慷慨动态路由选择方法,包括利用车联网中的车载导航平台, 当源节点产生一个需要传送到目的节点的数据包后,通过路由发现和路由维护来进行路由选 择,其特征在于,所述路由发现中,源节点的路由缓存器中存储多条可将数据包传送给目的 节点的路径,并选择信誉度最高的节点作为下一跳节点;所述信誉度最高的节点即估计数据 包转发比率NGDRt(x)值最大的节点;节点的估计数据包转发比率NGDRt(x)的计算方法如下: 1)计算每个节点的路由选择比率RRti→γj):

公式1:

其中,i表示中央节点,j表示中央节点的邻居节点,为广播路由请求数据包的下一跳节 点视作j;t表示节点发送新的广播数据包的时段序号;表示第t时段所有节点实际 转发的数据包数量,表示第t时段目的节点需要获得中央节点i让其邻居节点集转 发的数据包数量;

2)计算多路径权值CRRt(x):

公式2:CRRt(x)=ΣYRRt(γiγy)·RRt(γyγx)

其中,x为当前节点,x∈Ψt,Ψt表示第t时段内中央节点和邻居节点的集合, y∈Y∈{Ψt-x};CRRt(x)它表示源节点到目的节点所有路径的权重总和;

3)计算节点的平均路由选择转发率ARRt(x)

公式3:ARRt(x)=CRRt(x)ΣYRRt(γiγy)

4)计算路由选择数据包损失率RLRt(x):

公式4:RLRt(x)=1-ARRt(x)

5)计算节点的慷慨的丢包博弈比率GDRt(x):

公式5:GDRt(x)=DCLt-1(x)-DCLt-1(-x)2

公式6:DCLt(x)=RLRt(x)-GDRt(x),t00,t=-1

其中,-x为当前节点的对应下一跳邻居节点,t-1为第t时段的上一时间段;DCLt(x)表 示t时段路由选择数据包损失率RLRt(x)和慷慨的丢包博弈比率GDRt(x)的差值;由t=-1时, DCLt(x)=0,可用迭代法由上述公式,求得GDRt(x);

6)计算节点的估计数据包转发比率NGDRt(x):

公式7:NGDRt(x)=tan-1(40GDRt(x)-20)+π2π;

NGDRt(x)表示t时段内当前节点x对其下一跳节点-x的估计数据包转发比率。

进一步的技术方案是:上述路由发现的步骤为:

1)源节点广播多个请求数据包,并将自己的地址记录在请求数据包中;网络中每一个途 经的转发节点也将自己的地址记录在请求数据包中;

2)目的节点发回多个回复数据包给源节点;

3)源节点进而获得了多条可以将数据包传送给目的节点的路径,并将多条已经记录的路 径存到路由缓存器中;

4)当前节点从路由缓存器中存储的多条路径记录中,选择信誉度最高的节点作为下一跳 节点;

5)如果下一跳节点严重重复而造成路径拥塞,则选择路由缓存器中记录的多条路径中下 一个信誉度最高的节点作为下一跳节点,直到将数据包传送成功。

更进一步的技术方案是,上述路由维护的步骤为:如果当前节点在选择路径时,路由缓 存器中没有路径可以到达目的节点,或者路由已失效,则立刻重新执行路由发现阶段算法, 动态寻找新的路由路径。

本发明的有益效果:首先,本发明通过在路由发现阶段使用博弈理论进行路由选择,可 以有效的对车辆节点的历史行为进行信誉评价,隔离不协作的自私车辆节点,有效降低了自 私行为的影响。其次,本发明使用更加慷慨的博弈方法,加入一种慷慨的博弈因子,结合车 联网数据包收发特性来,减少了对协作车辆的误判。第三,在路由发现阶段,使用路由缓存 器存储多条路由路径来达到更稳定的路由,能够适应车联网的移动性和信息拥塞的情况。同 时,由于自私的节点只有协作才能得到自身想要的信息,所以本方法起到了间接激励节点的 作用。本发明能使信息在车联网中的更加有效的传输,并在节能方面产生了一定的效果。

附图说明

图1为基于博弈理论归一化的慷慨动态路由选择方法的流程图;

图2为路由发现过程;

图3为实验所用某市某路段地图;

图4为车联网中随着源节点和目的节点对数数量变化,使用NGDR路由方法和基于GTFT、TFT 策略转发数据包数量变化的比较;

图5为车联网中随着传输速率变化的转发数据包数量变化为车联网中随着传输速率变化,使 用NGDR路由方法和基于GTFT、TFT策略转发数据包数量变化的比较;

图6为车联网中随着时间阶段变化,使用NGDR路由方法和基于GTFT、TFT策略转发数据包数 量变化的比较;

图7为车联网中随着源目的节点对数数量变化,使用NGDR路由方法和基于GTFT、TFT策略接 收数据包数量变化的比较;

图8为车联网中随着时间变化,使用NGDR路由方法和基于GTFT、TFT策略中间转发节点能量 变化的比较;

图9为车联网中随着时间变化,使用NGDR路由方法和基于GTFT、TFT策略自私转发节点能量 变化的比较。

具体实施方式

下面结合附图及具体实施方式对本发明做进一步的介绍:

在车联网中,车辆节点可以选择为其它车辆转发或丢弃数据包,这一决策体现为一个参 与者的策略选择。这类博弈是一个非零博弈,所有的参与者可以通过协作转发和发送信息来 获得更多的消息,因此相比其它不协作的方式,所有协作的参与者能获得有利的结果。本发 明假设车联网中的参与者是动态无限重复博弈,车辆节点有无限个阶段在转发数据包。实际 上,当车辆加入该网络后即开始博弈直到离开,同时无限博弈能使整个网络达到更加协作的 情形。

本发明所提出的路由选择方法按照如图1所示的流程框图进行,具体如图2所示,当车 辆传感器节点A(源节点)产生一个新的数据包需要传送到目的车辆传感器节点E(目的节点)。 A广播多个请求数据包并将它的地址记录在请求数据包中,然后这些请求数据包在网络中每 一个途经的转发节点,如图2中的B、C和D节点,都将自己的地址记录在请求数据包中。最 终,E发回多个回复数据包给A节点,这些回复数据包中包含一系列的之前记录地址序列, 于是A通过这种方式获得了多条地址序列可以将数据包转发到E。

每个节点都会配有一个路由缓存器来缓存已经记录的多条路径,路由缓存器初始化设置 为空,如果节点的选择路径时,路由缓存器中没有合适的路径,节点A将会开始调用路由发 现过程来动态的获得到达E节点。

在车联网中,每个车辆节点广播请求数据包来发现传输数据包的路径,在一定功率范围 内的节点都可以收到请求。本发明所提出的基于博弈理论归一化的慷慨动态路由选择方法(简 称NGDR路由方法),博弈工作机制在这一阶段开始,不是实际发送数据包,而是依靠广播较 小的请求数据包来隔离和绕过自私节点。当节点A收到多条最短的路径并放入路由缓存器后, 要决定选择哪个节点作为下一跳转发节点。

每个节点都缓存有体现其信誉度的数值,与此同时,每个成功转发中间节点地址被一个 接一个记录下来,直到找到最终的目的节点。如果在路由缓存器中已有路径可以到达目的节 点,则发送节点会选择信誉最好的节点作为下一跳节点;但如果发生了任何拥塞或下一跳节 点严重重复,则在其余备选节点中选择信誉最好的节点作为下一跳节点。

由于车辆节点动态多变的特点,每个节点在不同的时段,信誉都有可能不同,本发明用 NGDRt(p)来衡量某个节点p在t时段的信誉度,NGDRt(p)表示节点p在t时段对下一跳节点 的转发估计数据包转发比率;t为节点发送新的广播数据包的时段序号,其取值为t=[-1,+∞), 且t∈Z。估计数据包转发比率计算方法如下:

首先,计算每个节点的路由选择比率RRti→γj)、多路径权值CRRt(x)、节点的平均路由 选择转发率ARRt(x):

公式1:

公式2:CRRt(x)=ΣYRRt(γiγy)·RRt(γyγx)

公式3:ARRt(x)=CRRt(x)ΣYRRt(γiγy)

其中,将源节点视作中央节点i,且i∈I,广播路由请求数据包的下一跳节点视作中央节 点的邻居节点j,所有邻居节点的集合为{j1,j2,...,jn}∈J;Ψ=I∪J,Ψt表示第t时段内中央 节点和邻居节点的集合,x为当前节点,x∈Ψt,y∈Y∈{Ψt-x};表示第t时段所 有节点实际转发的数据包数量,表示第t时段目的节点需要获得中央节点i让其邻 居节点集转发的数据包数量;RRti→γj)是路由选择比率,多路径权值CRRt(x)表示源节点到 目的节点所有路径的权重总和;ARRt(x)为节点的平均路由转发率,当t=0或-1时,表示还没 有新的广播数据包要发送,视作相当需要转发的数据包数量和实际转发的数据包数量相等, 所以此时段路由选择比率RRti→γj)=1,那么平均路由转发率ARRt(x)=1。

其次,根据下列式子计算路由选择数据包损失率RLRt(x)和慷慨的丢包博弈比率GDRt(x):

由于车联网中的车辆节点动态的在路道上移动(会发生加入或离开这个车联网络),还有 许多其他的干扰条件,该协议必须保持所有路径是有效。路由选择数据包损失率RLRt(x)表示 丢弃数据包的概率。因此,大于实际的丢包率,是一个会将小部分协作节点错误判断为自私 节点的数值,从而充分结合了车联网中数据包实际收发情况为路由协议提供依据。路由选择 数据包损失率RLRt(x)由公式4表示:

公式4:RLRt(x)=1-ARRt(x)

公式5:GDRt(x)=DCLt-1(x)-DCLt-1(-x)2

公式6:DCLt(x)=RLRt(x)-GDRt(x),t00,t=-1

其中,-x为当前节点的对应下一跳邻居节点,t-1为第t时段的上一时间段;DCLt(x)表 示t时段路由选择数据包损失率RLRt(x)和慷慨的丢包博弈比率GDRt(x)的差值;

由于当t=0或-1时,由于此时没有新的广播数据包要发送,所以DCLt(x)=0,

同样其下一跳节点DCLt(-x)=0;所以当t=0时,有公式5可知GDR0(x)=0;

当t=1,有公式5可知GDR1(x)=0;

故由公式6可知DCL1(x)=RLR1(x);DCL1(-x)=RLR1(-x)

所以当t=2,有公式5可知

其中,RLR1(x)和RLR1(-x)可由公式4求得;

此时,DCL2(x)=RLR2(x)-GDR2(x)=RLR2(x)-RLR1(x)-RLR1(-x)2

依次类推,用迭代的方法求得其他时段节点的慷慨的丢包博弈比率GDRt(x)。

最后,计算节点的估计数据包转发比率NGDRt(x):

公式7:NGDRt(x)=tan-1(40GDRt(x)-20)+π2π;

NGDRt(x)表示t时段内当前节点x对其下一跳节点-x的估计数据包转发比率,公式5-7 为模型的归一化差值推导过程。

不在源发送节点功率范围内的车辆都是靠多跳的形式传输数据,由于源节点和目的节点 间常常有很长的距离,因此本发明要适应车联网这类中间节点数量和经过的节点序列随时变 化的特点。如图2所示,当传感器节点A使用一条路径传输数据包到节点E时,路由维护用 于维护路由路径。被使用的路径常常由于快速移动的节点和多样的网络拓扑结构被干扰或中 断,因此,为了达到使每个传感器节点和其他节点相互协作转发数据包,用路由维护动态寻 找新的路由路径以适应快速变化的通信链路和网络拓扑结构。如发现缓存器中没有需要的路 径或路很已失效,则立刻重新执行路由发现阶段算法。

本发明所使用的是博弈论里的动态无限重复博弈,为了对动态博弈中纳什均衡进行精炼, 使动态博弈整体达到博弈均衡策略组合,需要证明子博弈完美均衡。子博弈完美均衡是指在 动态无限重复博弈中,在每一个子博弈都是存在纳什均衡,最终达到整体子博弈完美均衡策 略组合。因此,总折扣平均收益方程如公式8所示。在经典的无限博弈中,Ut(x)表示总的参 与者的折扣收益,最终希望得到最大化的折扣收益,因此,

Ut(x)=Σt=0μt(x)·δt-1

公式8:Ut(x)=U0+1-2αδ-2αϵ(2α-1)[1-δ2(1-ϵ)2]

其中μt(x)是参与者在时间t内的折扣收益,ε是一个数据包被转发但未被监听的概率。α 表示当节点转发数据包后所获得的信誉值。δ是折扣因子。NGDR路由方法是子博弈完美且 是纳什均衡的当且仅当δt=max{0.5,12α-2αε+0.5ε}。

本发明所提出的NGDR路由方法软件程序可运行安装在车载导航平台上,从路由层角度出 发,为车主使用的车载导航系统的业务层提供更经济安全的保障。该车载导航平台功能可具 有或不具有GPS全球卫星定位系统,具有GPS配合电子地图的车载导航平台,它能方便且准 确地告诉驾驶者去往目的地的最短或者最快路径,是驾驶员的好帮手。不使用GPS配合电子 地图的车载导航平台,可提供图文及视频流下载等服务。

下面结合仿真实验及附图对本发明的实施作进一步说明,仿真试验对本发明所提出的 NGDR路由方法同GTFT策略、TFT策略进行比较:

表1  仿真平台参数配置

地点 某市 平台大小 171辆车 无线信道 双径传播模型 MAC层协议 IEEE 802.11标准 物理层协议 250米 道路范围 3000*3000平方米 交通流量 CBR(2packets/s) 数据包大小 512字节

如表1所示,使用ns-2作为仿真工具,仿真的场景的参数设置为:3000*3000平方米的 仿真平台共有171辆车辆,节点的无线功率范围为250米,无线链路带宽为2Mbps,采用IEEE 802.11标准的MAC层协议,数据包大小为2数据包每秒,仿真时间为300s。

表2  数据样例

表2为实验所使用的数据部分样例,该数据是在某市各街道监控系统监控到的交通流数 据。L_out为车辆出口地点,D_out为车辆出口方向,L_in为车辆入口地点,D_in为车 辆入口方(表中数字为道路监控系统编号),T_time为间隔时间(秒),Speed表示速度(米 /秒),Matched_count为匹配到的车辆数辆(辆)。

图3为仿真真实道路交通使用的某市的部分道路地图。

如图4所示,当源目标节点数量大于40时NGDR路由方法相较GTFT策略明显转发更多数 据包,TFT策略不是慷慨的算法,由于车联网报文受到车辆移动、信息冲突及其他干扰原因, 数据包的发送和转发不能被有效的监听到,所以TFT策略在实际情况中不能达到对转发数据 包进行准确测量,会产生一定的误判,TFT策略效果较差。GTFT策略没有在车联网中结合实 际收发数据产生的丢包比率提出更合适的修改。随着车联网中参与者的增加,NGDR路由方法 能够达到更高的吞吐量和更好的连通性,能够适用更大的交通流量。

如图5所示,当CBR业务流从3数据包每秒增加到5数据包每秒时,使用NGDR路由方法 明显更具优势。这是因为NGDR路由方法慷慨的估计因子弥补了协议对协作车辆的错误判断。

如图6所示,表示当车辆到达目标后停留一段时间再移动到下一个目标,车辆的速度分 布在0米每秒到20米每秒,CBR业务流量为3数据包每秒。由于信息的洪泛,会造成一定的 信息拥塞,相比其它策略,NGDR路由方法的多路径机制体现出较好的拥塞情况处理。

如图7所示,当源目的节点对数量大于40后,相比其它策略使用NDGR路由方法能够收 到更多的数据包,原因是由于TFT策略没有慷慨性,不能很好的检测到数据包被转发了,会 产生较大的丢包比率,因此不利于消息数据包的传播。

如图8和图9所示,从能量的角度评价NGDR路由方法的一些性能,仿真车辆的初始能量 为300J。图8表示中间转发车辆节点的能量变化情况,尽管NDGR路由方法中节点能量略微 低于其它协议,其主要原因为NGDR路由方法中转发量远远大于其它策略(如图4所示),但 其剩余能量却仅略低一点。图9表示自私车辆节点的能量变化情况,当时间大于160秒后, NGDR路由方法下的自私节点较其它协议能量略高,这是由于其它协议错误的将自私节点判断 为协作节点。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号