首页> 中国专利> 基于神经网络的旋翼无人机的自适应逆控制方法

基于神经网络的旋翼无人机的自适应逆控制方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于神经网络的旋翼无人机的自适应逆控制方法，其特征在于，按照下式进行控制：其中：η是学习率，和分别是隐含层中第p个神经元与输出层中第t个神经元第n+1次和第n次训练后的值，和分别是输入层中第m个神经元与隐含层中第p个神经元第n+1次和第n次训练后的值，和分别表示能力函数EC对变量Wtp和Vpm的负梯度方向。利用两个神经网络分别建立旋翼无人机系统模型的正向模型和逆向模型，从而实现对完整旋翼无人机的控制和辨识。

著录项

公开/公告号CN104880945A

专利类型发明专利
公开/公告日2015-09-02

原文格式PDF
申请/专利权人成都市优艾维机器人科技有限公司;
展开▼

申请/专利号CN201510150003.8
发明设计人张洪斌;谢荣强;王刚;张红雨;
展开▼

申请日2015-03-31
分类号G05B13/04(20060101);
代理机构51216 四川君士达律师事务所;
代理人芶忠义
地址 610000 四川省成都市高新区天府大道中段1388号1栋12层1292号
入库时间 2023-12-18 10:45:37

法律信息

法律状态公告日

法律状态信息

法律状态
2019-05-24

专利权人的姓名或者名称、地址的变更 IPC(主分类):G05B13/04 变更前: 变更后: 申请日:20150331

专利权人的姓名或者名称、地址的变更
2018-05-29

授权

授权
2016-04-27

实质审查的生效 IPC(主分类):G05B13/04 申请日:20150331

实质审查的生效
2015-09-02

公开

公开

说明书

技术领域

本发明属于无人机技术领域，涉及一种基于神经网络的旋翼无人机的自适应逆控制方法。

背景技术

旋翼无人机是一种能够垂直起降、以若干个旋翼作为动力装置、不载操作人员的一种飞行器。它以能够垂直起降，任意悬停等灵活的控制方式以及结构简单噪声小等特点，近年来逐步成为了一个研究热点。由于旋翼无人机动力学模型具有强耦合、欠驱动以及强非线性等特点，设计出一个有效的旋翼无人机控制器是非常不易的，尤其是在对象模型参数变化以及外界有干扰的情况下。在现有的技术中，一般的做法是将旋翼无人机动力学模型进行简化，以降低其控制器设计的复杂程度，进而利用传统或现代控制方法对该简化模型进行控制器设计。

在现有技术对旋翼无人机控制器设计方法中，一般的做法是将旋翼无人机动力学模型进行简化处理，来减低其控制器设计难度。但是，简化动力学模型进行控制器设计也必将导致系统模型不匹配的问题，进而使得在实际控制中，所设计的控制器达不到理想的控制效果。

发明内容

本发明的目的是提供一种基于神经网络的旋翼无人机的自适应逆控制方法，解决了现有技术中存在的问题，利用两个神经网络分别建立旋翼无人机系统模型的正向模型和逆向模型，从而实现对完整旋翼无人机的控制和辨识。

本发明所采用的技术方案是，一种基于神经网络的旋翼无人机的自适应逆控制方法，按照下式进行控制：

$W_{tp}^{n + 1} = W_{tp}^{n} + η (- \frac{\partial E_{C}}{\partial W_{tp}}),$

$V_{pm}^{n + 1} = V_{pm}^{n} + η (- \frac{\partial E_{C}}{\partial W_{pm}}),$

其中：η是学习率，和分别是隐含层中第p个神经元与输出层中第t个神经元第n+1次和第n次训练后的值，和分别是输入层中第m个神经元与隐含层中第p个神经元第n+1次和第n次训练后的值，和分别表示能力函数E_C对变量W_tp和V_pm的负梯度方向。

本发明的有益效果是，利用神经网络具有较强的非线性映射能力，对旋翼无人机完整模型进行控制器设计。利用两个神经网络分别建立旋翼无人机系统模型的正向模型和逆向模型，从而实现对完整旋翼无人机的控制和辨识。系统辨识器(正向模型)的作用是为系统逆控制器提供学习信号，进而实现逆控制器对外界干扰和旋翼无人机自身参数变化具有良好的鲁棒性。没有对旋翼无人机系统模型进行任何简化处理，而直接对完整的旋翼无人机模型进行控制器设计。由于完整旋翼无人机系统模型与真实旋翼无人机系统具有更好的一致性，因此本发明设计的控制器在实际旋翼无人机飞行中，具有更好的控制效果。

附图说明

图1是本发明中控制系统框架图。

图2是处理后的样本集对系统辨识器的训练方法图。

图3是处理后的样本集对逆系统控制器的训练方法图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

建立旋翼无人机理想系统模型情况下的系统辨识器和逆系统控制器，以达到系统辨识器反映理想系统模型的输入输出关系，逆系统控制器反映理想逆系统模型的输入输出关系。当目标信号值输入到如图1所示的控制系统时，由于外界干扰、载重变化等原因使得系统模型输出与目标输出产生误差，通过自适应算法对系统辨识器和逆系统控制器做反馈校正已使得控制系统对外界干扰和载重变化具有良好的鲁棒性。在本发明中，系统辨识器的作用是建立一个等效于系统对象输入输出之间的映射关系，为逆系统控制器提供学习信息。

本发明一种基于神经网络的旋翼无人机的自适应逆控制方法，具体按照以下步骤进行：

1.训练样本集采集

白噪声信号可以激励出系统的全部特征。因此用幅值一定的白噪声信号作为样本采集时的系统激励信号，并用该激励信号激励旋翼无人机对象，得到该激励下对象的对应输出。循环该操作，得到一个合适大小的训练样本集。

2.样本处理

对样本集进行筛选处理。由于旋翼无人机在正常飞行过程中姿态角变化不大，因此在本发明中总是限定姿态角大小在-10°～10°，并以此为标准对输出超过该范围的样本进行筛选处理。虽然经过处理的样本弱化了所映射的非线性强度，但是这种处理大大简化了神经网络结构和训练时间，并且符合旋翼无人机的实际飞行情况。

3.确定系统辨识器和逆系统控制器的神经网络结构

神经网络的输入层和输出层的神经元数目是由所需拟合的非线性函数决定的，而隐含层的神经元数目是由经验得到的。根据图2和图3所示的基于BP原理的训练方法，可以确定系统控制器网络和系统辨识器网络的输入层神经元和输出层神经元数目都为9个和3个。根据确定隐含层的经验公式：其中，m表示隐含层神经元数目，n表示输入层神经元数目，l表示输出层神经元数目，a为1-10之间的常数。因此，可以把隐含层神经元的数目确定为10个。在本方案中，可以确定系统控制器和系统辨识器采用相同结构的BP神经网络：神经网络各层神经元数采用9×10×3的结构且隐含层激活函数采用S型对数函数，即(其中，x表示隐含层中各神经元的输入，f(x)表示隐含层中各神经元的输出)。

4.系统辨识器和逆系统控制器训练

根据已确定的神经网络结构，利用处理后的样本集对系统辨识器和逆系统控制器进行训练，训练方法如图2、图3所示。系统辨识器是利用样本集中白噪声信号作为输入信号，对应对象输出信号作为系统辨识器的训练目标信号进行训练。逆系统控制器是利用样本集中对象输出信号作为输入信号，对应的白噪声信号作为系统控制器的训练目标信号进行训练。

5.自适应算法设计

根据BP算法原理，设计系统辨识器和逆系统控制器的自适应算法。自适应算法的具体设计过程在下文给出。

6.在线调整

当对象实际输出与目标输出有误差时，将该误差作为反馈信号，利用自适应算法对系统辨识器和逆系统控制器的网络权值做反馈调整。

其中，控制系统的自适应算法设计是本发明中的核心内容。以下给出基于BP原理自适应算法设计过程。为了方便后续工作的阐述，给出以下定义和说明：

系统辨识器和逆系统控制器的网络结构都为M×P×T，即输入层神经元数目为M个，隐含层神经元数目为P个，输出层神经元数目为T个。

对于逆系统控制器，V＝(V_pm)_P×M,W＝(W_tp)_T×P分别表示输入层与隐含层之间、隐含层与输出层之间的连接权值矩阵(V_pm和W_tp分别表式输入层第m个神经元到隐含层第p个神经元的连接权值和隐含层第p个神经元到输出层第t个神经元的连接权值)。并且，为方便叙述，定义V_p:＝(V_p1,V_p2,…,V_pM),p＝1,2,…P；W_t:＝(W_t1,V_t2,…,V_tP),t＝1,2,…T，分别表示第一层权值矩阵中与隐含层第p个神经元相关联的的权值向量和第二层权值矩阵中与输出层第t个神经元相关联的的权值向量。

与上述逆控制器对应，在系统辨识器中，Q＝(Q_pm)_P×M,U＝(U_tp)_T×P分别表示输入层与隐含层之间、隐含层与输出层之间的连接权值矩阵(Q_pm和U_tp 分别表式输入层第m个神经元到隐含层第p个神经元的连接权值和隐含层第p个神经元到输出层第t个神经元的连接权值)。用HI＝(HI_p)_P×1,HO＝(HO_p)_P×1分别表示系统控制器中隐含层的输入、输出向量(HI_p和HO_p分别表示隐含层中第p个神经元的输入、输出)，X_I,X_C分别表示系统辨识器和逆系统控制器的输入向量。

y_d＝(φ_d,θ_d,ψ_d),y＝(φ,θ,ψ),分别为系统目标输出，系统对象实际输出和系统辨识器实际输出。其中，φ_d,θ_d,ψ_d表示目标欧拉角，φ,θ,ψ表示实际输出欧拉角，表示实际输出的欧拉角角速度。系统辨识器误差向量和逆系统控制器误差向量分别为e_c＝y-y_d。

分别建立系统辨识器和逆系统控制器的误差能量函数：

$E_{I} = \frac{1}{2} {(y (k) - \overset{\cdot}{y} (k))}^{2} - - - (1)$

$E_{C} = \frac{1}{2} {(y (k) - y_{d} (k))}^{2} - - - (2)$

在整个系统控制系统中，注意到系统辨识器的误差是在其输出端，因此它在线调整的自适应算法是常规的BP算法或改进的BP算法，这里直接给出基于梯度下降的BP算法。

根据E_I与U,Q之间的映射关系，E_I分别对U_tp,Q_pm求偏导，可得：

$\frac{\partial E_{I}}{\partial U_{tp}} = e_{It} \frac{1}{1 + e^{- Q_{p} X_{I}}} - - - (3)$

$\frac{\partial E_{I}}{\partial Q_{pm}} = γ_{p} X_{Im}^{T} U_{p}^{T} e_{I} - - - (4)$

其中， $γ_{p} = \frac{1}{{1 + e}^{- Q_{p} X_{I}}} (1 - \frac{1}{{1 + e}^{- Q_{p} X_{I}}}) .$

r_p是方便书写定义的变量，没有实际含义。

因此，便得到系统辨识器的在线调整的自适应算法：

$U_{tp}^{n + 1} = U_{tp}^{n} + η (- \frac{\partial E_{I}}{\partial U_{tp}}) - - - (5)$

$Q_{pm}^{n + 1} = Q_{pm}^{n} + η (- \frac{\partial E_{I}}{\partial Q_{pm}}) - - - (6)$

下面设计逆系统控制器的在线自适应算法。为了得到误差能量函数E_C对的W_tp偏导我们首先计算和根据系统辨识器的神经网络结构，得到：

$y_{t} = Σ_{p = 1}^{P} U_{tp} f (Σ_{m = 1}^{M} Q_{pm} X_{Im}) - - - (7)$

因此，

$\frac{\partial y_{t}}{\partial u_{k}} = Σ_{p = 1}^{P} U_{tp} f (Σ_{m = 1}^{M} Q_{pm} X_{Im}) (1 - f (Σ_{m = 1}^{M} Q_{pm} X_{Im})) Q_{pk} - - - (8)$

根据逆系统控制器的神经网络结构，可以得到：

$u_{k} = Σ_{p = 1}^{P} W_{tp} f (Σ_{m = 1}^{M} V_{pm} X_{Cm}) - - - (9)$

因此，

$\frac{\partial u_{k}}{\partial W_{tp}} = f (Σ_{m = 1}^{M} V_{pm} X_{Cm}) - - - (10)$

因为在线调整前，系统辨识器已经做离线训练，并且在逆系统控制器调整前，首先做了系统辨识器的在线调整，因此可以认为此时所以，

$(\begin{matrix} \frac{\partial E_{C}}{\partial W_{tp}} = \frac{\partial E_{C}}{\partial y_{1}} \frac{\partial y_{1}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + \frac{\partial E_{C}}{\partial y_{2}} \frac{\partial y_{2}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + \frac{\partial E_{C}}{\partial y_{3}} \frac{\partial y_{3}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} \\ = e_{c 1} \frac{\partial y_{1}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + e_{c 2} \frac{\partial y_{2}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + e_{c 3} \frac{\partial y_{3}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} \\ \approx e_{c 1} \frac{\partial {\overset{\cdot}{y}}_{1}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + e_{c 2} \frac{\partial {\overset{\cdot}{y}}_{2}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} + e_{c 3} \frac{\partial {\overset{\cdot}{y}}_{3}}{\partial u_{k}} \frac{\partial u_{k}}{\partial W_{tp}} \end{matrix}) - - - (11)$

结合上述(8)(10)(11)结果可得：

$(\begin{matrix} \frac{\partial E_{C}}{\partial W_{tp}} \approx e_{c 1} Σ_{j = 1}^{P} [U_{1 j} f (Σ_{m = 1}^{M} Q_{jm} X_{Im}) (1 - f (Σ_{m = 1}^{M} Q_{jm} X_{Im})) Q_{jk}] f (Σ_{m = 1}^{M} V_{pm} X_{Cm}) \\ + e_{c 2} Σ_{j = 1}^{P} [U_{2 j} f (Σ_{m = 1}^{M} Q_{jm} X_{Im}) (1 - f (Σ_{m = 1}^{M} Q_{jm} X_{Im})) Q_{jk}] f (Σ_{m = 1}^{M} V_{pm} X_{Cm}) \\ + e_{c 3} Σ_{j = 1}^{P} [U_{3 j} f (Σ_{m = 1}^{M} Q_{jm} X_{Im}) (1 - f (Σ_{m = 1}^{M} Q_{jm} X_{Im})) Q_{jk}] f (Σ_{m = 1}^{M} V_{pm} X_{Cm}) \end{matrix})$

同理，为了得到误差能量函数E_C对V_pm的偏导首先计算据逆系统控制器神经网络结构，得到：

HO_p＝f(HI_p) (12)

${HI}_{p} = Σ_{m = 1}^{M} V_{pm} X_{Cm} - - - (13)$

所以有，

$\frac{\partial {HO}_{p}}{\partial {HI}_{p}} = f ({HI}_{p}) (1 - f ({HI}_{p})) - - - (14)$

$\frac{\partial {HI}_{p}}{\partial V_{pm}} = X_{Cm} - - - (15)$

$\frac{\partial E_{C}}{\partial {HO}_{p}} = \frac{\partial E_{C}}{\partial u_{1}} \frac{\partial u_{1}}{\partial {HO}_{p}} + \frac{\partial E_{C}}{\partial u_{2}} \frac{\partial u_{2}}{\partial {HO}_{p}} + \frac{\partial E_{C}}{\partial u_{3}} \frac{\partial u_{3}}{\partial {HO}_{p}} - - - (16)$

又因为，

$(\begin{matrix} \frac{\partial E_{C}}{\partial u_{k}} = \frac{\partial E_{C}}{\partial y_{1}} \frac{\partial y_{1}}{\partial u_{k}} + \frac{\partial E_{C}}{\partial y_{2}} \frac{\partial y_{2}}{\partial u_{k}} + \frac{\partial E_{C}}{\partial y_{3}} \frac{\partial y_{3}}{\partial u_{k}} \\ = e_{c 1} \frac{\partial y_{1}}{\partial u_{k}} + e_{c 2} \frac{\partial y_{2}}{\partial u_{k}} + e_{c 3} \frac{\partial y_{3}}{\partial u_{k}} \end{matrix}) - - - (17)$

所以，综上可得：

这样就得到了基于BP算法原理的逆系统控制器的在线调整的自适应算法：

$W_{tp}^{n + 1} = W_{tp}^{n} + η (- \frac{\partial E_{C}}{\partial W_{tp}}),$

$V_{pm}^{n + 1} = V_{pm}^{n} + η (- \frac{\partial E_{C}}{\partial W_{pm}}) .$

其中，η是学习率。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于神经网络的旋翼无人机的自适应逆控制方法 [P] . 中国专利： CN104880945B . 2018.05.29
2. 基于抗饱和有限时间自适应神经网络容错技术的四旋翼植保无人机跟踪控制方法 [P] . 中国专利： CN113961010A . 2022-01-21
3. A method for controlling a path of a rotary-wing drone, a corresponding system, a rotary-wing drone implementing this system and the related uses of such a drone [P] . 欧洲知识产权局专利： EP2960154A1 . 2015-12-30

机译：用于控制旋翼无人机的路径的方法，相应的系统，实施该系统的旋翼无人机以及这种无人机的相关用途
4. A METHOD FOR CONTROLLING A PATH OF A ROTARY-WING DRONE, A CORRESPONDING SYSTEM, A ROTARY-WING DRONE IMPLEMENTING THIS SYSTEM AND THE RELATED USES OF SUCH A DRONE [P] . 欧洲知识产权局专利： EP2960155A3 . 2016-05-04

机译：控制旋翼无人机的路径的方法，相应的系统，实施该系统的旋翼无人机及其相关用途
5. METHOD FOR CONTROLLING A PATH OF A ROTARY-WING DRONE, A CORRESPONDING SYSTEM, A ROTARY-WING DRONE IMPLEMENTING THIS SYSTEM AND THE RELATED USES OF SUCH A DRONE [P] . 美国专利： US2015370258A1 . 2015-12-24

机译：控制旋翼无人机的路径的方法，相应的系统，实施该系统的旋翼无人机及其相关用途