首页> 中国专利> 低轨卫星网络中基于Q学习的切换判决方法

低轨卫星网络中基于Q学习的切换判决方法

摘要

本发明属于移动通信技术领域,涉及一种低轨卫星网络中基于Q学习的切换判决方法;所述判决方法包括采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销制定出用户终端关联不同候选卫星的收益函数;计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星;本发明不仅极大地降低了用户终端的切换失败率,而且有效地均衡了网络负载。

著录项

  • 公开/公告号CN113038387A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN202110267062.9

  • 发明设计人 李云;刘梦梦;吴广富;

    申请日2021-03-12

  • 分类号H04W4/029(20180101);H04W36/00(20090101);H04W36/22(20090101);H04W36/30(20090101);

  • 代理机构50215 重庆辉腾律师事务所;

  • 代理人卢胜斌

  • 地址 400065 重庆市南岸区南山街道崇文路2号

  • 入库时间 2023-06-19 11:35:49

说明书

技术领域

本发明属于移动通信技术领域,涉及一种低轨卫星网络中基于Q学习的切换判决方法。

背景技术

由于基站部署困难等问题的限制,地面蜂窝网络不能提供偏远山区、海洋、高原等地区的移动业务。卫星通信通过多颗卫星进行联合组网形成卫星星座,具有覆盖范围广、不受地域和空域限制的特点引起人们的关注。卫星通信网络与地面移动通信网络的融合将成为移动通信的重要发展方向。其中低轨卫星系统因具有低时延、路径损耗小以及覆盖面积广等特点而受到人们的广泛关注,然而由于卫星相对地面的高速移动以及用户终端的移动性,单颗低轨卫星对地面终端的覆盖时间有限,用户终端在进行通信时需要进行频繁地切换。常见的卫星切换包括星间切换和波束切换。波束切换主要涉及到卫星的信道分配问题,常用的信道分配包括排队切换、信道预留等技术,相关研究已经很成熟。本发明内容主要针对星间切换中的星地链路切换。

目前,星间切换中都是基于仰角、服务时间、空闲信道数、接收信号强度这些因素进行单属性或多属性决策,都是基于当前时刻下做出的最优切换判决;但是这些切换策略都没有考虑终端的运动特性对切换过程的影响,且当前时刻的最优选择在用户的整个通信时长内未必是最优;此外,并未将卫星拓扑结构对切换过程造成的影响考虑在内,导致了用户切换失败率和新呼叫阻塞率较高。

发明内容

基于现有技术存在的问题,本发明的目的在于提供一种低轨卫星网络中基于Q-learning的切换判决方法。该算法首先考虑用户终端的移动性,运用高斯马尔可夫模型和卫星的星历信息预测出用户终端可能的切换路径。然后考虑候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子制定用户终端关联不同卫星的收益函数。最后用户终端根据Q值表来进行切换判决,使得用户终端关联到合适的卫星。

本发明提供如下解决方案以解决上述技术问题:

一种低轨卫星网络中基于Q学习的切换判决方法,所述方法包括以下步骤:

S1、采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;

S2、基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,制定出用户终端关联不同候选卫星的收益函数;

S3、计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;

S4、根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;

S5、用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星。

本发明的有益效果:

本发明考虑用户终端的移动性,首先运用高斯马尔可夫模型对终端轨迹进行预测,然后结合卫星的星历信息,可获得在终端的整个通信时长内可能的切换路径;其次,考虑候选卫星集中候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,通过层次分析法确定不用因子的权重,设置终端关联不同卫星的收益函数,运用Q学习(Q-learning)算法进行切换判决,得到在终端的通信时长内最优的切换路径。本发明不仅极大地降低了用户终端的切换失败率,而且有效地均衡了网络负载。

附图说明

图1是本发明实施例中低轨卫星网络中基于Q学习的切换判决方法流程图;

图2是本发明实施例中的低轨卫星网络中的切换场景;

图3是本发明实施例中卫星的覆盖时间图;

图4是本发明实施例中预测到的终端可能的切换路径;

图5是本发明实施例中所采用的中继开销图;

图6是本发明实施例的切换失败率;

图7是本发明实施例的新呼叫阻塞率。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本发明实施例中的一种低轨卫星网络中基于Q学习的切换判决方法流程图,如图1所示,所述方法包括:

S1、采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;

由于低轨卫星和终端的移动特性,单颗卫星对地面提供服务的时间有限,终端需要不断地接入切换到新的卫星中去保证持续的通信过程。假设用户终端的通信时长t满足均值为T的指数分布,则其概率密度函数可表示为:

终端的运动模式可通过终端的运动速度和方向描述,因此在终端的通信时长t内,采用高斯马尔科夫模型对其行为模式进行建模:

其中,v

x

y

根据上述分析可得到预测到的终端的运动轨迹,如图2中实线所示。

由于低轨卫星运行的角速度较大,卫星对地面的覆盖是有限的,具体覆盖情况如图3所示。不同卫星之间覆盖时间有重叠表示用户终端可在两颗卫星之间进行切换,如图3中,处于卫星1服务下的用户终端进行切换时可选择切换到卫星2或卫星3。

由于低轨卫星的运动具备周期性的特点,因此结合卫星的星历信息和预测到的终端轨迹,可以得到在用户终端的通信时长内可提供服务的候选卫星。同时图3中各卫星对地面终端的覆盖情况可通过一个有向图表示,如图4所示。本方法的目的是将用户终端建模为智能体,运用Q-learning算法找到在用户终端的通信时长内的最优的切换判决集,最大化用户终端的服务体验。

S2、基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,制定出用户终端关联不同候选卫星的收益决策;

为了将状态空间定义为有限的,本发明将卫星的特性映射为量化之后的值,具体可描述为S(t)={{s

在卫星的切换决策中,智能体的动作表示用户可关联的候选卫星,动作集合可表示为a(t)∈{1,2,...,k},k表示用户终端可关联的候选卫星编号。本方法研究的是用户切换卫星的决策问题,进而提高用户的切换成功率,以及均衡卫星网络负载。因此把用户从当前服务卫星采取动作a切换到另一个卫星时,用户的体验质量定义为用户采取某个动作获得的奖赏值。

为了保证用户终端的服务体验和卫星网络负载均衡。因此,本发明考虑采用卫星的接收信号强度、服务时间、卫星负载状态以及中继开销四个切换因子来进行切换卫星的决策,具体如下。

A.接收信号强度

卫星信号在传输的过程中会经历各种损耗,包括自由空间传播损耗、大气损耗、云层损耗、降雨损耗等。无线电波从天线发射后在自由空间中传播,无线电波携带的能量会扩散到地球表面。卫星离地球越远,信号在传输工程中的损耗越大,信号强度越低。其中,自由空间传播损耗是传输过程中的主要损耗。自由空间传播损耗L

若以分贝为单位,则

用L

L

基于上述分析,用户终端的接收信号强度可以表示为:

S=P

其中,P

B.卫星服务时间

卫星的服务时间影响用户终端切换次数,在用户终端的通信过程中,服务时间越长的卫星,用户终端的切换次数越低。因此卫星的服务时间被选为切换因子。将卫星的服务时间定义为卫星对地面终端的可视时间,用t

C.卫星负载状态

卫星的负载状态描述了卫星的空闲信道数,卫星空闲信道数越多,表明卫星处于轻负载状态,能够给用户终端带来更好的服务体验;卫星空闲信道数越少,表明该卫星更容易发生拥塞。本方法考虑采用信道利用率来衡量卫星的负载状态。N

空闲信道数较多的卫星的信道利用率较低,这表示该卫星可接纳更多的用户终端,用户终端的切换成功率更高;信道利用率较高的卫星表明其空闲信道数较少,选择该卫星进行切换时可能造成切换失败或者网络拥塞。

D.中继开销

如图5所示,在用户终端关联卫星的过程中,为了提高用户终端的切换成功率,用户终端会倾向于选择负载较轻的候选卫星进行切换,但这有可能增加用户终端的切换时延,因此将切换代价作为切换决策的一个因子。

如图6所示,由于终端和卫星的移动,处于S

t

因此,本方法考虑采用卫星的接收信号强度、服务时间、卫星负载状态以及终极开销四个切换因子来进行切换卫星的决策。

R(s,a)=w

其中,R(s,a)表示在状态s下选择决策动作a的收益奖赏;N(u

S3、计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;

按照上述公式R(s,a)=w

卫星的信道利用率U越高,表示卫星的可用资源越少,用户选择该卫星进行切换时更容易造成网络拥塞,故信道利用率的归一化函数定义为:

本文假设在上一时刻卫星的截止时刻用户切换到候选卫星中,则该候选卫星可为用户提供通信的时长为

t

接收信号强度越大的候选卫星,表示切换到该卫星后,该卫星能提供给用户更好的服务质量,将接收信号强度值的函数定义为:

s

中继开销主要指的是用户的切换时延,为了提高用户的服务体验,切换过程中的时延要尽可能的低,因此将中继开销的函数定义为:

切换因子的权重可通过层次分析法(AHP,analytic hierarchy process)来确定。该方法主要包含以下步骤:

步骤1:构造判断矩阵,构造判断矩阵采用的方法是一致矩阵法,即将切换因子两两相互比较,来提高准确度。

在所有切换因子中,空闲信道数决定切换能否成功,用户难以接受通信的被迫中断,故认为空闲信道数是影响用户服务体检(QoE)的最重要因素;服务时间影响切换次数,故将其作为第二重要的切换因子;接收信号强度影响用户的通信质量,将其作为第三重要的因子;中继开销主要影响了用户的时延,将其作为第四重要的切换因子。

判断矩阵的标度方法如表1所示:

表1判断矩阵的标度方法

根据上述对切换因子的重要性分析,可以构造出判断矩阵A:

步骤2:各因子的权重计算。与判断矩阵最大特征根λ

即w

经过上述分析,可将用户选择切换卫星的奖赏函数可用下式表示:

R(s,a)=0.5694N(u

在另一些实施例中,本发明还可以采用基于信息熵冗余度的方式来计算这四个切换因子的权重,具体可以包括:

根据这四个切换因子的重要性标度确定出判断矩阵;

对初始判断矩阵进行归一化处理;

计算出每个切换因子的信息熵,表示为

按照所述信息熵所对应的冗余度RE

具体的权重公式表示为:

本实施例考虑多个切换因子来解决卫星的切换问题,可有效减少不必要的切换次数以及无线链路失败率;本发明通过信息熵冗余度的方式获取各个切换因子的权重,使得赋权结果更具合理性。

S4、根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;

基于上述分析,可得到基于Q-learning的切换判决方法如表2所示:

这里状态集合S={{s

S5、用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星。

在本发明实施例中,可以根据奖赏值R和Q值更新公式,可以计算出不同状态下采取不同动作获得的Q值,这些Q值构成的是一个Q值表,有几个状态就是几阶矩阵,用户终端按照Q值表进行具体的判决,从而让对应的用户终端关联到卫星。

仿真:

假设终端的速度为60m/s,通话时长为25min。用户终端的学习率α=1,折扣率γ=0.8。其余仿真参数如表2所示。

表2仿真参数

图6比较了本发明所提算法与最大仰角策略的切换失败率进行对比。由图可知,随着用户终端数量的增加,两种算法的切换失败率均增加,但本发明所提算法的切换失败率仍然低于最大仰角策略,这是因为基于最大仰角策略选择切换卫星时,用户终端仅考虑候选卫星的仰角,而忽略了候选卫星的负载情况,因此用户终端的切换失败率较高;本发明所提的基于q-learning的切换算法,考虑候选卫星的多个属性,找出通信过程中最佳的切换路径,有效地降低了用户终端的切换失败率。

图7比较了本发明所提算法与最大仰角策略的新呼叫阻塞率。由图可知,随着新呼叫用户终端数量的增加,两种算法的阻塞率均增加,但本发明所提算法的新呼叫阻塞率仍然低于最大仰角策略,这是因为本发明所提算法考虑了候选卫星的多个属性,综合判断候选卫星的特性,然后利用q-learning进行最优决策,可有效地降低新呼叫阻塞率。

在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号