首页> 中国专利> 一种基于时空径向基函数神经网络的容错飞行控制方法

一种基于时空径向基函数神经网络的容错飞行控制方法

摘要

本发明公开了一种新型针对多旋翼飞行器执行器故障的具有新融合核的时空径向基函数神经网络容错控制方法。利用一种新型的具有时空信息扩展的径向基函数神经网络处理具有时间动态特性和空间非线性的信号,比传统处理一维信号的径向基函数神经网络有更高的估计信号精度的优势。针对多旋翼飞行器模型不确定性、执行器故障以及阵风干扰问题,将时空径向基函数神经网络的参数输出用于积分反步滑模控制器设计容错控制律,可使系统鲁棒控制提高的同时,故障飞行器的轨迹就可在短时间内转向平衡点。本发明用于一类含有多旋翼飞行器多执行器故障、模型不确定性和阵风扰动的飞行器的故障容错飞行控制。

著录项

  • 公开/公告号CN114815861A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202110072013.X

  • 发明设计人 杨蒲;李德杰;王梓欣;

    申请日2021-01-19

  • 分类号G05D1/08(2006.01);G05D1/10(2006.01);

  • 代理机构

  • 代理人

  • 地址 211106 江苏省南京市江宁区胜太西路169号南京航空航天大学将军路校区自动化学院

  • 入库时间 2023-06-19 16:20:42

说明书

技术领域

本发明涉及一种基于时空径向基函数神经网络的容错飞行控制方法,属于不确定性非线性系统的容错控制技术领域。

背景技术

随着航空器和航天器研制技术水平的提高,许多集成度高、工程复杂的飞行器被制造出来,并且广泛地服务于人类发展的各个行业领域。在信息技术高速发展的背景下,各种飞行器已经随处可见,它们被应用于农业、安防监控、物资运输、仓储巡检、民用航拍等领域,而不仅仅在国防、民航、救灾等领域被使用。近年来,随着轻量级多旋翼飞行器所执行的任务和工作环境愈加多样性,其组成结构也越加复杂。它们通常由各部分子系统组成,如导航系统、动力系统、控制系统、功能组件等。由于对飞行器高性能、智能化功能的需求,多旋翼飞行器在设计时通常需要考虑碰撞、电机卷入颗粒物体、电磁干扰、温度等原因造成故障或性能下降情况下飞行器飞行的安全性和可靠性。

由于多旋翼飞行器是典型的欠驱动系统,因此,保持在发生故障情形下姿态控制子系统的稳定性能是很多学者和研究人员研究的重点问题。一般情况下,多旋翼飞行器由多个旋翼提供动力,相比于固定翼、单螺旋桨形式的飞行器而言,在受到外界干扰、碰撞或发生故障丧失动力时,多旋翼飞行器很难依靠自身机体结构实现滑翔或利用变桨距减落下坠速度。近些年来,有研究人员提出了故障检测与隔离、鲁棒控制、可重构控制以及人工智能和预测分析等方法用于航空航天飞行器的控制性能的提高。但随着航空航天工程系统中集成度、复杂性的提高,需要考虑和设计的非线性化参数增多,尤其在发生故障后,模型的不确定性和扰动对系统会产生更加不利的影响。所以,研究复杂系统下的智能控制与传统非线性控制方法的融合,尤其是针对飞行器故障状态下姿态系统的稳定性研究,是一项具有挑战性和前景性的工作,这也是近年来很多研究学者研究的热点。

由于多旋翼无人机在发生故障情况时,如果不能够及时准确的识别故障,便会直接导致无人机发生坠毁。而在系统发生故障后,提高系统可控性的一种有效方法是利用具备故障诊断和容错性能的控制器作为故障系统的解决方案。随着容错控制领域的发展,很多研究人员尝试在执行器故障的情况下进行容错控制算法的尝试。被动式容错控制也称为无源容错控制,研究人员可以利用一类可预知的故障实现了控制系统的有限容错能力。相比之下,主动容错方法能够检测和识别系统中发生的故障,并通过设计好的相应的控制器能够实现更好的系统控制性能。滑模控制技术可以被用来设计主动容错方案可以实现执行器故障的补偿。实际上在工程应用中多旋翼无人机的模型不确定性是广泛存在的。随着多旋翼无人机负载设备的增加,多旋翼无人机的系统模型愈加复杂,模型中非线性参数也随之增加。而神经网络是被认为解决复杂非线性系统中函数逼近的理想选择,并在各种智能控制系统中得到了应用。

所以,本发明将具有时空信息扩展的径向基函数神经网络与反步滑模控制器的优势相结合,针对执行器存在的偏差故障、增益故障以及飞行器受到阵风扰动的情况,充分利用时空径向基函数神经网络逼近含有非线性项和误差项融合参数的能力来处理系统的故障和建模不确定性,利用自适应反步滑模控制器作为系统的整体性控制,并进一步优化系统的控制响相应。

目前,许多学者提出了新型的径向基函数神经网络的控制方法,但是,在系统存在故障情况的问题上很少有更深入的研究。因此,本发明在时空径向基函数神经网络的基础上,将其应用于多旋翼飞行器的容错控制。

发明内容

发明目的:针对多旋翼飞行器存在执行器偏差故障、增益故障的问题,考虑系统中存在模型不确定性、阵风扰动的情况,设计了一种新型的基于自适应时空径向基函数神经网络与反步滑模控制器相结合的主动容错控制方法。在该方法中,利用具有时间和空间信息扩展的径向基函数神经网络,处理含有故障和不确定性融合参数的辨识;并将该网络用于阵风扰动参数的估计;设计了具有自适应参数调整的融合核,提高了神经网络估计参数的精确度;利用反步滑模控制器作为系统的整体性控制,将神经网络的估计参数引入其中,进而设计了容错控制律,保证了全局的鲁棒性和抗干扰性。

技术方案:一种新型针对多旋翼飞行器执行器故障的具有新融合核的时空径向基函数神经网络容错控制方法,其特征在于:1)提出了一种主动容错控制方法,能够同时适应存在执行器故障和模型不确定的多旋翼飞行控制系统,并且,所提出的容错控制器能够抵抗阵风扰动的同时,在时变故障下的具备容错控制效果,能够通过自适应调整不确定性项和扰动参数,减少了设定参数,提高了系统的鲁棒性;2)本方法采用一种新型融合核的时空径向基函数神经网络,能够快速的估计故障数据和不确定性参数值,将故障飞行数据用于神经网络权重参数训练,利用训练好的模型进行估计更大故障值的测试数据,进一步迭代训练,提高网络对故障数据的准确估计性能,提高容错性;3)将反步滑模控制器应用于系统的整体稳定性控制,实现了飞行容错控制器快速、准确的估计执行器故障值。包括如下具体步骤:

步骤1)确立仿射非线性系统故障模型:

步骤1.1)对于正常状态下的多旋翼飞行器可以考虑如下仿射非线性模型,

其中,状态向量

步骤1.2)对于多旋翼飞行器在受到风扰环境下力矩形式的定义,本方法以具有代表性的四旋翼飞行器模型为例,表示如下的风扰数学模型,

其中,d

步骤1.3)对于同时具有执行器增益故障和偏差故障的多旋翼飞行器,选取如下的执行器故障模型,

u

其中,α(t)∈(0,1]为包含执行器增益故障的参数,τ(t)为包含执行器加性故障的参数。u

步骤1.4)考虑以上步骤中存在的情况,对于具有阵风扰动、执行器增益故障和偏差故障的多旋翼飞行器仿射非线性系统,其数学模型表示为

其中,f

步骤2)设计基于自适应融合核的时空径向基函数神经网络辨识器:

步骤2.1)设计时空径向基函数神经网络

径向基函数神经网络一般由输入层、隐藏层和输出层组成。时空径向基函数具有时间动态特性和空间非线性(复杂性)信号的优势,实在传统的径向基函数神经网络的方法上提出的,具体设计如下:

第一层(输入层):根据系统状态变量的数据以及控制器输出数据,输入层的输入信号为飞行器姿态角、角速度和控制律信号,可以表示为

第二层(隐藏层):本文在非线性隐藏层设计时考虑了信号处理中对神经网络的内核空间上进行了时间扩展,设计了两个并行的时间层与输入层中两组时刻对应,用于映射信号在时间上的动力学和非线性特性。ψ

其中,

第三层(输出层):输出层采用线性组合输出。考虑时空径向基函数神经网络用于估计参数

给出本文采用的时空径向基函数神经网络的整体映射如下:

其中,

设计基于时空扩展的径向基函数神经网络的梯度下降学习算法为:

其中,w

将公式(10)代入到公式(9)中,可以得到

w

同理,设计b(k)的学习规则为:

b(k+1)=b(k)+η

步骤2.2)设计新型自适应融合核

为了提高径向基函数神经网络的估计精度,利用欧几里得和余弦距离度量可以自适应调整核的权重的优点,本方法优化了时空径向基函数神经网络初始权重值的需要,新的融合核表示如下:

ψ

其中,高斯核函数ψ

其中,ι→0

为获取新核中的学习规则,参考公式(11)中的设计方法,设计权重系数Υ

同样的,通过链式微分法可以得到

相应的,在对公式取其偏导数之后可以得到Υ

相似的,Υ

步骤3)容错控制器设计

步骤3.1)根据仿射非线性系统的数学模型,定义系统控制器的参考输入信号为x

其中,ε

由此,可以得出ε

为了使系统更好的实现滑动模态,选取系统的积分滑模面为:

步骤3.2)为了使最后设计好控制律使系统稳定,本方法中采用了自适应方法估计系统中未知的参数。定义控制律中涉及到的不确定项、阵风扰动项、故障参数项相关参数的自适应律可以设计为:

其中,γ

同时,为了满足系统稳定性条件,需要将其定义为

步骤3.3)根据以上参数设置,对具有执行器故障、建模不确定项和阵风扰动的非线性系统,设计完整的容错控制律为

其中,ι为正常数,存在κ

有益效果:针对多旋翼飞行器在各类复杂环境中可能发执行器增益故障、偏差故障以及阵风扰动的情况,考虑了系统建模过程中存在建模误差项,本方法设计了一种新型针对多旋翼飞行器执行器故障的具有新融合核的时空径向基函数神经网络容错控制方法。由于设计的时空径向基函数神经网络利用了时空正交的概念,能够逼近系统中的含有故障和建模误差的非线性参数项,使得设计的容错飞行控制器能够主动补偿执行器故障对飞行器的不利影响,并且能够估计风扰参数,提高了飞行器抗扰动的能力。设计中使用了自适应反步滑模控制器,增强了系统鲁棒性能,最终完成的容错飞行控制器在发生执行器故障情况下依然能够稳定飞行。本方法具有的优点如下;

(1)考虑传统的时空径向基函数在处理一维数据中有较高预测精度,但是在处理时域信号和空间信号的时间信号序列中精度较低,提出了一种新型的具有自适应融合核的时空径向基函数神经网络结构;利用时空径向基函数神经网络提高了预测时间信号(动力学)和非线性(复杂度)的精度;利用了欧几里德核和余弦核的往复特性,在非线性系统辨识、模式分类和函数逼近三个主要的估计问题上优于人工融合核的预测精度。该框架利用梯度下降法动态调整参与核的权值,从而减少对预定权重的需要。

(2)提出了一种主动容错控制方案,能够同时适应存在执行器故障和模型不确定的无人机飞行控制系统。并且,所提出的容错控制器能够抵抗阵风扰动的同时,在时变故障下具备良好的容错控制效果。采用的自适应反步滑模控制器,在系统发生执行器故障或干扰时,只需自适应调整不确定性项和扰动参数便可使系统达到滑模面,减少了设定参数,提高了系统的鲁棒性。

(3)本方法中的径向基函数神经网络采用了一种具有快速梯度下降的权重更新规则,能够快速的估计故障数据和不确定性参数值。本方法中将故障飞行数据用于神经网络权重参数训练,利用训练好的模型进行估计更大故障值的测试数据,进一步迭代训练,提高网络对故障数据的准确估计性能,提高容错性。

(4)与基于模型的故障观测器相比,本方法中针对模型中非线性项参数的变化,利用具有快速梯度下降的时空径向基函数神经网络估计参数值,同时将反步滑模控制器应用于系统的整体稳定性控制,实现了飞行容错控制器快速、准确的估计非线性融合参数。

附图说明

图1是本发明方法的系统运行流程图;

图2是测试实验系统平台框架图;

图3是四旋翼飞行器模型及其坐标系示意图;

图4是均方误差测试曲线;

图5是时空径向基函数神经网络和传统径向基函数神经网络的预测结果;

图6是时空径向基函数神经网络和传统径向基函数神经网络的预测误差;

图7是Qball-X4无人机无外界风扰和无执行器故障时姿态跟踪角度;

图8是Qball-X4无人机无外界风扰和无执行器故障时姿态跟踪误差;

图9是Qball-X4无人机有外界风扰和无执行器故障时姿态跟踪角度;

图10是Qball-X4无人机有外界风扰和无执行器故障时姿态跟踪误差;

图11是Qball-X4无人机有外界风扰和有执行器故障时姿态跟踪角度;

图12是Qball-X4无人机有外界风扰和有执行器故障时姿态跟踪误差;

图13是神经网络辨识器参数估计。

具体实施方式

下面结合附图对本发明做更进一步的解释。

如图1所示,考虑一类含有不确定性的非线性系统发生执行器故障和外界风扰的情况,将时空径向基函数神经网络与自适应反步滑模控制器相结合,利用滑模控制器实现系统全局稳定,将飞行器的状态数据用于神经网络的输入,依据时空径向基函数神经网络逼近非线性函数快速性和准确性的特性,将其输出用于系统中故障容错处理,最终完成容错飞行控制器的设计。具体步骤如下:

步骤1)确立仿射非线性系统故障模型:

步骤1.1)对于正常状态下的多旋翼飞行器可以考虑如下仿射非线性模型,

其中,状态向量

步骤1.2)对于多旋翼飞行器在受到风扰环境下力矩形式的定义,本方法以具有代表性的四旋翼飞行器模型为例,表示如下的风扰数学模型,

其中,d

步骤1.3)对于同时具有执行器增益故障和偏差故障的多旋翼飞行器,选取如下的执行器故障模型,

u

其中,α(t)∈(0,1]为包含执行器增益故障的参数,τ(t)为包含执行器加性故障的参数。u

步骤1.4)考虑以上步骤中存在的情况,对于具有阵风扰动、执行器增益故障和偏差故障的多旋翼飞行器仿射非线性系统,其数学模型表示为

其中,f

步骤2)设计基于自适应融合核的时空径向基函数神经网络辨识器:

步骤2.1)设计时空径向基函数神经网络

径向基函数神经网络一般由输入层、隐藏层和输出层组成。时空径向基函数具有时间动态特性和空间非线性(复杂性)信号的优势,实在传统的径向基函数神经网络的方法上提出的,具体设计如下:

第一层(输入层):根据系统状态变量的数据以及控制器输出数据,输入层的输入信号为飞行器姿态角、角速度和控制律信号,可以表示为

第二层(隐藏层):本发明在非线性隐藏层设计时考虑了信号处理中对神经网络的内核空间上进行了时间扩展,设计了两个并行的时间层与输入层中两组时刻对应,用于映射信号在时间上的动力学和非线性特性。ψ

其中,

第三层(输出层):输出层采用线性组合输出。考虑时空径向基函数神经网络用于估计参数

给出本发明采用的时空径向基函数神经网络的整体映射如下:

其中,

设计基于时空扩展的径向基函数神经网络的梯度下降学习算法为:

其中,w

将公式(10)代入到公式(9)中,可以得到

w

同理,设计b(k)的学习规则为:

b(k+1)=b(k)+η

步骤2.2)设计新型自适应融合核

为了提高径向基函数神经网络的估计精度,利用欧几里得和余弦距离度量可以自适应调整核的权重的优点,本方法优化了时空径向基函数神经网络初始权重值的需要,新的融合核表示如下:

ψ

其中,高斯核函数ψ

其中,ι→0

为获取新核中的学习规则,参考公式(11)中的设计方法,设计权重系数Υ

同样的,通过链式微分法可以得到

相应的,在对公式取其偏导数之后可以得到Υ

相似的,Υ

步骤3)容错控制器设计

步骤3.1)根据仿射非线性系统的数学模型,定义系统控制器的参考输入信号为x

其中,ε

由此,可以得出ε

为了使系统更好的实现滑动模态,选取系统的积分滑模面为:

步骤3.2)为了使最后设计好控制律使系统稳定,本方法中采用了自适应方法估计系统中未知的参数。定义控制律中涉及到的不确定项、阵风扰动项、故障参数项相关参数的自适应律可以设计为:

其中,γ

同时,为了满足系统稳定性条件,需要将其定义为

步骤3.3)根据以上参数设置,对具有执行器故障、建模不确定项和阵风扰动的非线性系统,设计完整的容错控制律为

其中,ι为正常数,存在κ

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

下面以实际案例仿真说明实施方案的有效性。

为了验证所出的方法的有效性,本方法中进行实物测试飞行的测试实验系统平台框架如图2所示,为了实现硬件的在环仿真,本实验中替换了QBall-X4的控制板为PixHawk4飞行控制器,替换了机载电脑为Jetson Nano。重新设计后的四旋翼无人机的初始模型参数的数值如表1所示。实验中通过机载电脑与电脑端地面站使用TCP/IP通信协议实现飞行器实时控制与状态监控。

表1 Qball-X4多旋翼飞行器参数

对于多旋翼飞行器的一般动力学模型,本方法的实例中以四旋翼飞行器为例,定义图3中的飞机示意模型是标准的四旋翼机体模型,在X型结构框架的四旋翼基础上建立机体坐标系(Body Frame)为O

通常,飞机的姿态由三个欧拉角表示[φ θ ψ]

其中,J=diag[J

参数Ω

其中,参数

在容错控制器的效果验证阶段,本方法主要通过地面端遥控器给出俯仰和横滚姿态的期望信号θ

场景1:在无外界风扰和无执行器故障的环境下测试基于时空径向基函数神经网络预测神经网络的自抗扰容错控制器的飞行效果;

场景2:数值仿真模拟3-9m/s的水平阵风扰动。通过飞行器在持续了一段时间的风扰情形下的效果,分析控制器的性能;

场景3:在场景2中阵风扰动的环境下,通过飞行器容错控制系统进一步给飞行器的1-4号电机注入指定故障值,对应的增益故障和偏差故障数据如表2所示。同时,在实验中,对故障数据增加了80分贝高斯白噪声干扰:

表2 Qball-X4多旋翼飞行器故障注入数据

在图7和8中显示的是场景1的实验数据,比较传统的径向基函数神经网络和时空径向基函数神经网络控制器的性能,本发明设计的飞行控制器与基于传统的径向基函数神经网络的控制器都能够实现良好的姿态跟踪控制。但是,对比图8中的跟踪误差曲线的变化,本发明的控制器具有更好的跟踪性能,误差也较小,可以看出,传统的径向基函数神经网络在飞行器抖动过程中并没有给出较为精确的估计值。图9和图10显示了场景2中飞行器在阵风扰动过程中飞行器姿态的控制效果。不难发现在存在干扰的情形下,基于传统径向基函数神经网络的控制器和基于时空径向基函数神经网络的反步滑模控制器都具备良好的跟踪性能,但是通过图10可以发现本发明提出的时空径向基函数神经网络在飞行器发生较大动作变化时具备的跟踪性能更好。对比图11和图12中俯仰和横滚控制器的跟踪效果,明显可以看出,传统径向基函数神经网络的控制器在第40秒故障注入时飞行器的跟踪误差发生了较大的变化,飞行器有失控的倾向,但是本发明提出的容错控制器在故障注入后依然保持着稳定的跟踪效果。图13中的参数1、参数2和阵风扰动曲线分别显示了俯仰和横滚控制器在场景3的测试中对参数

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号