首页> 中国专利> 模型未知的双电机负载的动态规划最优控制方法

模型未知的双电机负载的动态规划最优控制方法

摘要

本发明公开了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。该方法包括如下步骤:建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。建立针对性能指标函数的神经网络模型,结合哈密尔顿‑雅克比‑贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。根据所述最优输入力矩对相应电机的参数进行调节。

著录项

  • 公开/公告号CN108196446A

    专利类型发明专利

  • 公开/公告日2018-06-22

    原文格式PDF

  • 申请/专利权人 北京理工大学;

    申请/专利号CN201711337500.4

  • 发明设计人 任雪梅;吕永峰;李林伟;王敏林;

    申请日2017-12-14

  • 分类号

  • 代理机构北京理工大学专利中心;

  • 代理人高会允

  • 地址 100081 北京市海淀区中关村南大街5号

  • 入库时间 2023-06-19 05:39:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-17

    授权

    授权

  • 2018-07-17

    实质审查的生效 IPC(主分类):G05B13/04 申请日:20171214

    实质审查的生效

  • 2018-06-22

    公开

    公开

说明书

技术领域

本发明涉及自动控制技术领域。

背景技术

针对多电机伺服系统的控制方式,最优控制理论应用不甚成熟。对于线性系统,可以用黎卡提方程离线求解其最优控制。对于非线性系统求解最优控制,要建立系统的哈密尔顿函数。然而非线性系统的哈密尔顿-雅克比-贝尔曼(HJB,Hamilton-Jacobi-Bellman)方程因为“维数灾难”问题,求解比较困难,对非线性系统最优控制的求解造成巨大困难。因此目前通常用深度学习方法来求解HJB方程,形成基于自适应动态规划(ADP,AdaptiveDynamic Programming)方法的最优控制求解方法。

尤其近几年,针对自适应动态规划方法的研究取得巨大进步,但是应用该理论解决实际系统模型的研究成果仍然不多。

发明内容

有鉴于此,本发明提供了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。

模型未知的双电机负载的动态规划最优控制方法,该方法包括如下步骤:

建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。

建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。

结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。

根据所述最优输入力矩对相应电机的参数进行调节。

进一步地,双电机负载系统包括第1电机和第2电机,共2个电机。

所述方法还包括:

针对所述双电机负载系统,建立数学模型,为:

其中x1表示负载的转角,x2表示负载的转速,分别为x1,x2的导数,Ti为负载控制输入,r为负载的摩擦系数,J是负载的转动惯量,gi为第i电机的动态参数。

所述双电机负载系统的动态函数为:

所述双电机负载系统为:

其中x为所述双电机负载系统状态x=[x1,x2]T

进一步地,估计所述双电机负载系统的神经网络模型的权重参数,具体为:

采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。

进一步地,建立所述双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:

S101、所述双电机负载系统包括第1电机和第2电机,共2个电机。

建立针对所述双电机负载系统的神经网络模型:

其中x为所述双电机负载系统状态;为x的导数。

W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值代替;其中即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵。

为所述双电机负载系统的神经网络激励函数,由系统状态x和第1电机和第2电机的输入力矩u1和u2决定。

S102、建立所述双电机负载系统状态x和激励函数φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f

为φ1f的导数,为xf的导数;k为预设的滤波参数。

S103、建立第一辅助矩阵P1和第二辅助矩阵Q1为设定的辅助参数经验值。

S104、建立第三辅助矩阵M1为:

S105、建立权重参数W1估计的自适应律为Γ1为设置的自适应参数经验值;当所述φ1为持续激励时,应用所述W1估计的自适应律估计获得

为预设的系统动态和输入动态的神经网络激励函数。

进一步地,建立所述性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数,具体包括:

S201、建立性能指标函数:

其中,为第i电机对应的性能指标;为代价函数;

Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;

Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;

S202、建立针对所述性能指标函数的神经网络模型为:

其中Vi(x)为的神经网络输出函数;的神经网络模型的激励函数,由系统状态x决定;Wci为权重参数,采用如下步骤S205~S207获取的估计值代替。

S203、构建哈密尔顿-雅克比-贝尔曼HJB方程

其中为代价函数;的梯度。

为神经网络逼近误差。

S204、根据解得第i电机的最优输入力矩为:

为根据估计值得到的Wgi的估计值。

S205、建立第四辅助矩阵P2和第五辅助矩阵Q2

每个电机对应一个性能指标;则对应第i个性能指标的第四辅助矩阵P2iP2i(0)=0;对应第i个性能指标的第五辅助矩阵Q2iQ2i(0)=0。

其中Θi=ri(x,u1,u2)和

S206、建立第六辅助矩阵M2,对应第i个性能指标的第六辅助矩阵M2

建立参数Wci估计的自适应律为Γ2i为设置的自适应参数经验值。

当所述为持续激励时,应用所述Wci估计的自适应律估计获得

有益效果:

本发明首先应用神经网络精确逼近;利用辨识神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。本发明求解双电机负载系统各电机的最优输出,使负载按既定的轨迹运行,同时使各电机状态最优。

附图说明

图1为本发明实施例所针对的多电机负载系统结构图;

图2为本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法流程示意图;

图3为本发明一个实施例中负载模型未知动态参数;

图4为本发明一个实施例中电机一最优指标估计参数;

图5为本发明一个实施例中电机二最优指标估计参数;

图6为本发明一个实施例中负载速度轨迹;

图7为本发明一个实施例中电机一控制输入;

图8为本发明一个实施例中电机二控制输入。

具体实施方式

下面结合附图并举实施例,对本发明进行详细描述。

请参考图1和图2,图1示出了本发明实施例所针对的双电机负载系统结构框图。图2示出了本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法,包括如下步骤:

S1、建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。

S2、建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数;

S3、结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩;

S4、根据所述最优输入力矩对相应电机的参数进行调节。

本发明首先应用神经网络精确逼近;利用神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。

本发明实施例中,双电机负载系统包括第1电机和第2电机,共2个电机。在步骤S1之间,还需建立双电机负载系统的系统状态表达式。

因此本步骤S1之前还包括:

针对所述双电机负载系统,建立数学模型,为:

其中x1表示负载的转角,x2表示负载的转速,分别为x1,x2的导数,Ti为负载控制输入,r为负载的摩擦系数,J是负载的转动惯量,gi为第i电机的动态参数。

所述双电机负载系统的动态函数为:

所述双电机负载系统为:

其中x为所述双电机负载系统状态x=[x1,x2]T

本发明实施例中,在步骤S1中,估计所述双电机负载系统的神经网络模型的权重参数,具体为:

采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。

在本发明实施例中,S1具体包括如下步骤:

建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:

S101、所述双电机负载系统包括第1电机和第2电机,共2个电机;

建立针对所述双电机负载系统的神经网络模型:

其中x为所述双电机负载系统状态;为x的导数;

W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值代替;其中即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵;

为所述双电机负载系统的激励,由系统状态x和第1电机和第2电机的输入力矩u1和u2决定;

S102、建立所述双电机负载系统状态x和激励φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f

为φ1f的导数,为xf的导数;k为预设的滤波参数;

S103、建立第一辅助矩阵P1和第二辅助矩阵Q1为设定的辅助参数经验值;

S104、建立第三辅助矩阵M1为:

S105、建立参数W1估计的自适应律为Γ1为设置的自适应参数经验值;当所述φ1为持续激励时,应用所述W1估计的自适应律估计获得

为预设的系统动态和输入动态的神经网络激励函数,。

在本发明实施例中,S2具体包括如下步骤:

S201、建立性能指标函数:

其中,为第i电机对应的性能指标;为代价函数

Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;

Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;

S202、建立针对所述性能指标函数的神经网络模型为:

其中Vi(x)为的神经网络输出函数;的神经网络模型的激励函数,由系统状态x决定;Wci为权重参数,采用如下步骤S205~S207获取的估计值代替;

S203、构建哈密尔顿-雅克比-贝尔曼HJB方程

其中为代价函数;的梯度,

为神经网络逼近误差;

S204、根据解得第i电机的最优输入力矩为:

为根据估计值得到的Wgi的估计值;

S205、建立第四辅助矩阵P2和第五辅助矩阵Q2

每个电机对应一个性能指标;则对应第i个性能指标的第四辅助矩阵P2iP2i(0)=0;对应第i个性能指标的第五辅助矩阵Q2iQ2i(0)=0;

其中Θi=ri(x,u1,u2)和

S206、建立第六辅助矩阵M2,对应第i个性能指标的第六辅助矩阵M2

建立参数Wci估计的自适应律为i=1,2;Γ2为设置的自适应参数经验值;

当所述为持续激励时,应用所述Wci估计的自适应律估计获得

本发明实施例对上述处理结果进行仿真。假设双电机负载系统动力学模型为:

在仿真分析中,假设系统模型未知。首先应用神经网络逼近未知双电机负载模型,然后用S105中构建的自适应律估计未知系统特性参数神经网络输入向量设置为φ1=[x1,x2,u1,u2]T,系统状态初值设置为x1(0)=1,x2(0)=-1。其它参数适当调整,可估计得近似神经网络权重如图3所示,各被估参数都收敛到其真值。用评价神经网络逼近性能指标函数,评价神经网络近似权重参数收敛效果如图4所示和图5所示,两个电机的性能指标权重参数都快速收敛到最优值。图6为负载转角速度效果图。图7和图8分别为所求两个电机的最优输出,可以使系统稳定运行。

本发明针对模型未知双电机负载系统,根据发明中提出的基于辨识-评价神经网络结构的ADP方法,应用一种基于参数误差信息的自适应估计算法,能够对未知双电机模型实现精确辨识,对最优性能指标精确逼近,进而求得电机的最优控制输出。这种ADP方法可以加快被估参数收敛速度和最优控制求解速度,通过仿真可以看出,本发明具有良好的控制性能和一定的实用价值。

综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号