首页> 中国专利> 一种面向抗干扰的雷达频率捷变方法

一种面向抗干扰的雷达频率捷变方法

摘要

本发明提出一种面向抗干扰的雷达频率捷变方法,属于频率捷变和雷达抗干扰技术领域。本发明通过引入长短时记忆网络,利用深度强化学习获得频率捷变策略,使雷达能够综合当前观测和历史观测两方面的信息,自适应切换发射频率以避免干扰,能够同时应对复杂多变的电磁环境和雷达有限观测的问题。使用本发明中的方法,每部雷达能够通过不断切换频率减小相互间干扰,保证各自正常工作,适应由于相对运动造成的周围电磁环境的迅速变化。

著录项

  • 公开/公告号CN112198484A

    专利类型发明专利

  • 公开/公告日2021-01-08

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN202011014194.2

  • 发明设计人 刘一民;黄天耀;王希勤;刘鹏飞;

    申请日2020-09-24

  • 分类号G01S7/36(20060101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人廖元秋

  • 地址 100084 北京市海淀区清华园1号

  • 入库时间 2023-06-19 09:29:07

说明书

技术领域

本发明属于频率捷变和雷达抗干扰技术领域,尤其涉及一种面向抗干扰的雷达频率捷变方法。

背景技术

面对日益复杂的电磁环境,雷达抗干扰能力越来越受到研究人员的关注。雷达抗干扰方法一般可分为两类。一类是被动式,即在接收到干扰之后通过优化接收处理的方法消除或减轻干扰对于目标探测的影响。例如,时域傅里叶变换方法(pre-FFT)是在傅里叶变换之前在时域上将干扰信号置零,频域傅里叶变换方法(post-FFT)是在傅里叶变换之后在频域上将干扰信号出现的频段滤除,自适应波束形成是在空域上去抑制干扰。此外,还有一些在联合域去抑制干扰的方法,例如空时自适应处理等。但这类方法需要获得干扰信号在时、频或空域上的信息才能达到期望的抗干扰效果。

另一类是主动式,即雷达通过在时、空、频、码等维度上对发射信号进行选择和设计以达到避免干扰的目的。相比于被动抗干扰技术,主动抗干扰技术在抗干扰效能上具有更大潜力。捷变相参技术被认为是对抗干扰的最有效方式之一,它通过发射波形在时、空、频、码等多个维度快速捷变来避免与其他电磁设备在电磁资源上发生冲突进而减小干扰。频率捷变是捷变相参技术中应用最为广泛的方法之一。但目前频率捷变方式较为单一,往往是随机捷变或者进行人为设计后固定不变,在面对复杂多变的电磁环境时难以发挥频率捷变的抗干扰潜力。在一些研究中,强化学习的方法被引入到雷达频率捷变策略的设计中,使雷达能够根据自身观测自适应地选取发射频率,取得了一定抗干扰效能提升。但是,雷达单次观测到的信息往往较为有限,只依靠雷达单次观测难以获取最优频率捷变策略。

现有技术中,雷达频率捷变的方式大多固定单一,并受限于雷达的有限观测,并没有一种雷达频率捷变的方法能同时应对复杂多变的电磁环境和雷达有限观测的问题,导致频率捷变难以发挥其抗干扰的潜力。

发明内容

本发明的目的是为克服已有技术的不足之处,提出一种面向抗干扰的雷达频率捷变方法。本发明使雷达能够综合当前观测和历史观测两方面的信息,自适应切换发射频率以避免干扰,能够同时应对复杂多变的电磁环境和雷达有限观测的问题。

本发明提出一种面向抗干扰的雷达频率捷变方法,其特征在于,包括以下步骤:

(1)初始化;

(1-1)构建雷达频率选择估值网络Q

q

其中,θ为Q

将初始的估值网络Q

(1-2)构建雷达频率选择目标网络Q

其中,Q

将初始的目标网络Q

(1-3)创建一个初始为空的内存D,内存大小为L

(2)观测获取;

构建t时间步雷达获得的观测:

o

其中,f

其中,

其中,d

若雷达在t-1时间步所受干扰功率小于阈值

则t时间步雷达对离自身最近的第n个目标距离预测值为:

其中,Δt是相邻两个时间步间的时间间隔;

若雷达在t-1时间步所受干扰功率大于等于阈值

(3)频率选择与记忆更新;

将o

当前估值网络Q

其中,

雷达按照如下方式选择t时间步的频率,得到t时间步的雷达频率捷变结果:

其中,ò∈(0,1)是探索概率;

(4)经历构建与储存;

对t进行判定:

若t<2,则令t=t+1,然后重新返回步骤(2);

若t≥2,则构建t时间步的经历:e

(5)训练集构建;

从内存D中随机截取L

其中,τ为该训练集的起始时间步;若L

(6)构造代价函数;

对于步骤(5)构建的训练集中的每一个经历e

其中,γ∈[0,1]是衰减系数;

令初始记忆向量g

构造代价函数:

(7)网络参数更新;

利用梯度下降对当前估值网络Q

其中,α∈(0,1)为更新步长;更新后,令t←t+1,然后重新回到步骤(2);

其中,每隔设定的时间步数T时,对当前目标网络Q

本发明的特点及有益效果:

本发明针对目前频率捷变固定单一,并且受限于雷达的有限观测,难以发挥频率捷变雷达抗干扰潜力的问题,提出一种新的频率捷变方法,使雷达能够综合当前和历史观测自适应切换发射频率,以获得更好的抗干扰效果。

本发明通过深度强化学习获得一种频率捷变策略,使雷达根据自身观测不断切换发射频率,能够适应复杂多变的电磁环境,达到良好的抗干扰效果;同时,本发明通过引入长短时记忆网络,使雷达能够综合当前和历史观测来切换发射频率,解决了雷达单次观测不足的问题。

本发明适用于多部雷达工作在同一频段下的场景,尤其针对雷达所在平台快速运动的场景,例如汽车雷达场景与机载雷达协同作战的场景等,在民用和军事上均有广泛应用背景。使用本发明中的方法,每部雷达能够通过不断切换频率减小相互间干扰,保证各自正常工作,快速适应由于相对运动造成的周围电磁环境的迅速变化。随着雷达在民用和军事上的普及,雷达间的干扰问题将会日益严重,本发明所提出的方法能够缓解雷达数量增长和频谱资源有限的矛盾,提高雷达在复杂电磁环境中的生存能力。

附图说明

图1为本发明方法的整体流程图。

图2为本发明中雷达频率选择估值网络的结构示意图。

图3为本发明中雷达频率选择和记忆向量更新过程示意图。

具体实施方式

本发明提出一种面向抗干扰的雷达频率捷变方法,下面结合附图和具体实施例对本发明进一步详细说明如下。

本发明提出一种面向抗干扰的雷达频率捷变方法,整体流程如图1所示,包括以下步骤:

(1)初始化;

(1-1)构建雷达频率选择估值网络Q

q

其中,Q

图2给出了本发明的频率选择估值网络的结构示意图,该网络由一个全连接层和一个长短时记忆(Long Short-Term Memory,LSTM)层级联而成。t-1时间步的雷达的记忆向量即为t时间步LSTM层的隐状态,h

(1-2)构建雷达频率选择目标网络Q

其中,Q

(1-3)创建一个初始为空的内存D,内存大小为L

初始化时间步t=1。

初始化Q

(2)观测获取;

构建t时间步雷达获得的观测:

o

其中,f

其中,

由于雷达在t时间步选择频率并发射信号之前不能获得t时间步的目标距离的信息,本发明通过如下方法对t时间步的目标距离进行预测。

若雷达在t-1时间步所受干扰功率小于阈值

其中,Δt是相邻两个时间步间的时间间隔(即雷达两次发射的时间间隔,在本实施例中,Δt=0.1秒)。

若雷达在t-1时间步所受干扰功率超过阈值

(3)频率选择与记忆更新;

将雷达观测o

q

当前估值网络Q

其中,

其中,ò∈(0,1)是探索概率,在本实施例中,ò=0.05。

图3给出了本发明中雷达频率选择和记忆向量更新的过程示意图。图中纵向箭头表示雷达频率选择的过程:在每一时间步,雷达结合当前观测和记忆向量,通过估值网络获得对各个可选频率的评估向量,进而选择该时间步的频率。图中横向箭头表示雷达记忆向量更新的过程:横向箭头表示时间的递进,记忆向量随着时间不断更新;在每一时间步,雷达结合当前观测和上一时间步的记忆向量,通过估值网络获得该时间步的记忆向量,因此能够不断将新的观测融入到记忆向量中。

(4)经历构建与储存;

对t进行判定:

若t<2,则令t=t+1,然后重新返回步骤(2);

若t≥2,则构建t时间步的经历:e

其中,L

(5)训练集构建;

从内存D中随机截取L

其中,τ为该训练集的起始时间步;若L

(6)构造代价函数;

对于步骤(5)构建的训练集中的每一个经历e

其中,γ∈[0,1]是衰减系数,γ越大,表示选择t时间步的频率时对未来抗干扰效能r

令初始记忆向量g

其中,

基于目标值,构造代价函数:

其中,

q

其中,

(7)网络参数更新;

利用梯度下降对当前估值网络Q

其中,α∈(0,1)为更新步长(在本实施例中,α=1×10

其中,当每隔一定时间步数T(T是大于0的整数,在本实施例中T=10)对当前目标网络Q

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号