首页> 中国专利> 基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法

基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法

摘要

基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法,涉及一种航天器相对轨道转移轨迹优化方法。本发明为了解决追踪航天器在相对轨道坐标系中,现有的方法没有考虑推力幅值有限的问题和现有的方法只考虑时间最优或者只考虑燃料消耗问题。本发明首先建立相对轨道运动动力学模型分别设计沿三个轴施加的主动控制量ux,uy,uz;然后将相对轨道运动动力学模型解耦为三个子系统:解耦成三个子系统后,将追踪航天器考虑转移时间和燃料消耗的总性能指标转化为每个轴的单轴性能指标最终得到时间—燃料最优控制律为对追踪航天器进行控制。本发明适用于航天器相对轨道转移轨迹优化。

著录项

  • 公开/公告号CN104536452A

    专利类型发明专利

  • 公开/公告日2015-04-22

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN201510038688.7

  • 申请日2015-01-26

  • 分类号G05D1/08(20060101);

  • 代理机构23109 哈尔滨市松花江专利商标事务所;

  • 代理人杨立超

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-12-18 08:20:29

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-04-26

    授权

    授权

  • 2017-02-15

    著录事项变更 IPC(主分类):G05D1/08 变更前: 变更后: 申请日:20150126

    著录事项变更

  • 2015-05-20

    实质审查的生效 IPC(主分类):G05D1/08 申请日:20150126

    实质审查的生效

  • 2015-04-22

    公开

    公开

说明书

技术领域

本发明涉及一种航天器相对轨道转移轨迹优化方法。

背景技术

航天器的相对轨道运动是研究一个航天器(追踪航天器)处于另一个航天器(目标 航天器)周围的持续运动规律。轨道转移的研究重点主要在两个方面,一方面是考虑方案 能否正确引导航天器到达指定位置,另一方面是考虑完成轨道转移方案时,性能指标的评 价情况,要求快速机动则一般要考虑时间最优问题,从工程实际出发,航天器所携带的燃 料有限,因此有时要考虑燃耗最优问题,甚至是考虑时间和燃耗综合最优问题。解决最优 控制问题常用的基本方法有古典变分法,当对控制量有约束时,如推力器所能提供的推力 幅值有限,一般采用Pontryagin极小(大)值原理。

《有限推力能量、燃料最优轨道转移控制方法》,应用间接法研究了时间固定下的能 量、燃料以及能量-燃料最优有限推力轨道转移控制问题。针对燃料最优问题的奇异性引 入了能量性能指标,为解决燃料最优轨道转移问题应用了ε算法,设计最优控制器时应用 极小值原理,研究相应轨迹优化问题转化的两点边值问题时采用单值打靶法。其数值结果 表明了在相同推力、相同轨道转移时间条件下,给定了初始和目标轨道后轨道转移任务消 耗的燃料是确定的,推力大小只影响轨道转移的圈数。但是,该文献未能很好的解决两点 边值问题的求解,未能理论证明文献中的数值结果,是否具有普遍性仍需进一步研究。

发明内容

本发明为了解决追踪航天器在相对轨道坐标系中,现有的方法没有考虑推力幅值有限 的问题和现有的方法只考虑时间最优或者只考虑燃料消耗问题。进而提出了一种基于时间 -燃料最优控制的航天器相对轨道转移轨迹优化方法。

基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法,包括以下步骤:

步骤一、建立相对轨道运动动力学模型:

在地心惯性坐标系O-XIYIZI中,记目标航天器为s,追踪航天器为c;设目标航天器s处 在近圆轨道上,取目标航天器的轨道坐标系s-xyz作为相对运动坐标系,追踪航天器为c 相对目标航天器为s所处的位置为相对位置,在轨道坐标系s-xyz上建立相对位置的坐标; 轨道坐标系s-xyz与地心惯性坐标系O-XIYIZI的关系如图1所示;

在不考虑摄动的情况下,将目标航天器s与追踪航天器c在地心惯性系下的动力学方程 代入两者相对运动关系式,针对目标航天器s为圆轨道e=0,追踪航天器c和目标航天器s 相对距离较近,取一次近似(即线性化)进行简化,从而将相对运动动力学方程化简为常 系数线性微分方程组的形式

x··-2ny·-3n2x=uxy··+2nx·=uyz··+n2z=uz---(1)

式中的x、y、z分别为相对位置在s-xyz坐标系三个轴上的分量,分别是 x、y、z是的一阶导数,分别是x、y、z的二阶导数;n为目标航天器的平均运动 角速度rs是目标航天器到地心的距离,μ是地球引力常数,ux,uy,uz分别为 追踪航天器上沿三个轴施加的主动控制量;式(1)称为hill方程,也称Clohessey-Whiltshire 方程,简称C-W方程;

步骤二、将式(1)即C-W方程解耦为三个子系统:

令U=[ux,uy,uz]T,则式(1)可表示为如下形式

r·r··=03×3I3×3A1A2rr·+03×3I3×3U---(2)

其中r是相对位置即x,y,z的整体表示,分别为r的一阶导数和二阶导数;03×3和I3×3分 别表示3×3的零矩阵和单位矩阵,

A1=3n20000000-n2;A2=02n0-2n00000---(3)

相对轨道运动动力学模型的状态空间表达式如式(3)所示,轨道平面(xy平面)内的 相对运动在x和y方向上是相互耦合的,垂直于轨道平面(z方向)的相对运动为自由振荡运 动;

由于本发明研究的目标航天器处于圆形高轨道,以地球静止轨道为例说明,平均运动 角速度很小,计算得

n=2π24×60×607.2722×10-5rad/s---(4)

对于两航天器相对距离较近的轨道转移问题,距离一般为几十公里,则n2与距离乘积的 数量级一般为10-5m/s2,n与速度乘积的数量级一般为10-4m/s2,而连续控制所能达到 的控制量的数量级一般为10-2m/s2,因此,矩阵A1,A2都可近似看成零矩阵03×3,则状态 空间表达式可近似表示为

r·r··=03×3I3×303×303×3rr·+03×3I3×3U---(5)

[r,r·]T=[r,v]T=[x,y,z,x·,y·,z·]T按拆分成三个子系统, 分别为子系统的状态变量,将式(1)按三个坐标轴方向解耦,每一 个子系统都是形如式(6)所示的双积分系统,近似将追踪航天器和目标航天器的相对运 动看成分别沿三个坐标轴方向的直线运动,从而分别设计沿三个轴施加的主动控制量 ux,uy,uz

x·1=x2x·2=u---(6)

x1为三个子系统中相对位置x,y,z的通用表达形式,x2为三个子系统中相对速度的通用表达形式,x1、x2分别为x1(t)、x2(t)的简写;u为主动控制量ux,uy,uz的通用表达 形式,u为u(t)的简写;

连续控制时,考虑单轴的主动控制量u的幅值有上限,即|u|≤umax,当子系统达到 终端状态时,x2的终端状态x2f速度为零,即各子系统终端状态x2f=0;

解耦成三个子系统后,将追踪航天器考虑转移时间和燃料消耗的总性能指标 J=ρtf+0tf|ux|+|uy|+|uz|dt转化为每个轴的单轴性能指标

J=0tf[ρ+|u(t)|]dt,ρ0---(7)

其中,ρ为转移时间与燃料消耗的比重;

根据极小值原理,构造哈密顿函数

H=ρ+|u(t)|+λ1(t)x2(t)+λ2(t)u(t)          (8)

H为哈密顿函数,x(t)=[x1(t) x2(t)]T是状态量,λ(t)=[λ1(t) λ2(t)]T为协状态量;

此时可以得到最优控制

u*(t)=+umax,λ2*(t)<-10,-1<λ2*(t)<1-umax,λ2*(t)>1[0,+umax],λ2*(t)=-1[-umax,0],λ2*(t)=1---(9)

协态方程为

λ·1*=-Hx1*=0λ·2*(t)=-Hx2*=-λ·1*(t)---(10)

求解协态方程得

λ1*(t)=c1λ2*(t)=-c1t+c2---(11)

t为时间;u*(t)为最优主动控制量,为最优协状态,为 对时间的导数,c1、c2为常数;为J取极小值时的x1、x2,即最优 值;

哈密顿函数在终端时刻满足

H(tf*)=ρ+|u*(tf*)|+λ1*(tf*)x2*(tf*)+λ2*(tf*)u*(tf*)=0---(12)

步骤三、设计时间-燃料最优控制律并对追踪航天器进行控制:

可证明方程(10)不会存在奇异解;

时间-燃料最优问题存在六种候选的控制序列:

{0,+umax},{0,-umax},{+umax},{-umax},{+umax,0,-umax},{-umax,0,+umax}

在连续控制时,控制u的幅值有上限,即|u|≤umax,终端状态要求速度为零,即各 子系统要求x2f=0;求得整个时间-燃料最优相轨迹的开关曲线γ和μ,其方程为

γ=γ+γ-={(x1,x2)|x1=-12umaxx2|x2|+x1f}---(13)

μ=μ+μ-={(x1,x2)|x1=-ρ+4umax2umaxρx2|x2|+x1f}---(14)

γ+、γ-、μ+、μ-表示两条开关曲线的四个部分;x1f为x1的终端状态;

求得开关曲线γ后,依次讨论各个控制序列;即可得到开关曲线γ和控制序列的开关曲 线μ将相平面分为R1,R2,R3,R4四个区域,如图2所示,

R1={(x1,x2)|x1-12umaxx2|x2|+x1f,x1>-ρ+4umax2umaxρx2|x2|+x1f}R2={(x1,x2)|x1<-12umaxx2|x2|+x1f,x1-ρ+4umax2umaxρx2|x2|+x1f}R3={(x1,x2)|x1-12umaxx2|x2|+x1f,x1<-ρ+4umax2umaxρx2|x2|+x1f}R4={(x1,x2)|x1>-12umaxx2|x2|+x1f,x1-ρ+4umax2umaxρx2|x2|+x1f}---(15)

最终得到时间-燃料最优控制律为

u*(t)=+umax,(x1,x2)R30,(x1,x2)R2R4-umax,(x1,x2)R1---(16)

区域R2,R4的大小将随着ρ值的减小而增加;

三轴均按此时间-燃料最优控制律来对追踪航天器进行控制。

本发明具有以下有益效果:

1、在实际工程中推力器是有幅值上限的,与现有的一些连续控制下的轨道转移方案 相比,本发明考虑了推力器的幅值限制,更符合实际工程中的推力器。。

2、与一些只考虑时间最优或者只考虑燃料消耗问题的方案相比,本发明同时考虑了 转移时间和燃料消耗问题,可以通过调节两者所占的比重来找到该比重下时间-燃料最优 的控制方案。

3、与一些研究惯性系中的轨道转移不同,本发明研究的是相对轨道坐标系中的轨道 转移,相对轨道坐标系中的轨道转移起始点和终止点在惯性系中不是固定点,使得本发明 在航天器之间的相对轨道转移问题中具有更大的实际应用价值。

附图说明

图1相对运动坐标系与地心惯性坐标系的关系图;

图2相平面上的开关曲线与划分区域图;

图3控制序列为{+umax,0,-umax}时的相轨迹图;

图4Simulink仿真模型图;

图5三轴方向的位置随时间变化曲线图;

图6轨道转移的空间轨迹图;

图7到达末端位置的时间触发信号图;

图8三轴方向的控制量随时间变化曲线图;

图9轨道坐标系s-xyz的x轴方向上状态转移轨迹图;

图10轨道坐标系s-xyz的y轴方向上状态转移轨迹图;

图11轨道坐标系s-xyz的z轴方向上状态转移轨迹图。

具体实施方式

具体实施方式一:基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法,包 括以下步骤:

步骤一、建立相对轨道运动动力学模型:

在地心惯性坐标系O-XIYIZI中,记目标航天器为s,追踪航天器为c;设目标航天器s处 在近圆轨道上,取目标航天器的轨道坐标系s-xyz作为相对运动坐标系,追踪航天器为c 相对目标航天器为s所处的位置为相对位置,在轨道坐标系s-xyz上建立相对位置的坐标; 轨道坐标系s-xyz与地心惯性坐标系O-XIYIZI的关系如图1所示;

在不考虑摄动的情况下,将目标航天器s与追踪航天器c在地心惯性系下的动力学方程 代入两者相对运动关系式,针对目标航天器s为圆轨道e=0,追踪航天器c和目标航天器s 相对距离较近,取一次近似(即线性化)进行简化,从而将相对运动动力学方程化简为常 系数线性微分方程组的形式

x··-2ny·-3n2x=uxy··+2nx·=uyz··+n2z=uz---(1)

式中的x、y、z分别为相对位置在s-xyz坐标系三个轴上的分量,分别是 x、y、z是的一阶导数,分别是x、y、z的二阶导数;n为目标航天器的平均运动 角速度rs是目标航天器到地心的距离,μ是地球引力常数,ux,uy,uz分别为 追踪航天器上沿三个轴施加的主动控制量;式(1)称为hill方程,也称Clohessey-Whiltshire 方程,简称C-W方程;

步骤二、将式(1)即C-W方程解耦为三个子系统:

令U=[ux,uy,uz]T,则式(1)可表示为如下形式

r·r··=03×3I3×3A1A2rr·+03×3I3×3U---(2)

其中r是相对位置即x,y,z的整体表示,分别为r的一阶导数和二阶导数;03×3和I3×3分 别表示3×3的零矩阵和单位矩阵,

A1=3n20000000-n2;A2=02n0-2n00000---(3)

相对轨道运动动力学模型的状态空间表达式如式(3)所示,轨道平面(xy平面)内的 相对运动在x和y方向上是相互耦合的,垂直于轨道平面(z方向)的相对运动为自由振荡运 动;

由于本发明研究的目标航天器处于圆形高轨道,以地球静止轨道为例说明,平均运动 角速度很小,计算得

n=2π24×60×607.2722×10-5rad/s---(4)

对于两航天器相对距离较近的轨道转移问题,距离一般为几十公里,则n2与距离乘积的 数量级一般为10-5m/s2,n与速度乘积的数量级一般为10-4m/s2,而连续控制所能达到 的控制量的数量级一般为10-2m/s2,因此,矩阵A1,A2都可近似看成零矩阵03×3,则状态 空间表达式可近似表示为

r·r··=03×3I3×303×303×3rr·+03×3I3×3U---(5)

[r,r·]T=[r,v]T=[x,y,z,x·,y·,z·]T按拆分成三个子系统, 分别为子系统的状态变量,将式(1)按三个坐标轴方向解耦,每一 个子系统都是形如式(6)所示的双积分系统,近似将追踪航天器和目标航天器的相对运 动看成分别沿三个坐标轴方向的直线运动,从而分别设计沿三个轴施加的主动控制量 ux,uy,uz

x·1=x2x·2=u---(6)

x1为三个子系统中相对位置x,y,z的通用表达形式,x2为三个子系统中相对速度的通用表达形式,x1、x2分别为x1(t)、x2(t)的简写;u为主动控制量ux,uy,uz的通用表达 形式,u为u(t)的简写;

连续控制时,考虑单轴的主动控制量u的幅值有上限,即|u|≤umax,当子系统达到 终端状态时,x2的终端状态x2f速度为零,即各子系统终端状态x2f=0;

解耦成三个子系统后,将追踪航天器考虑转移时间和燃料消耗的总性能指标 J=ρtf+0tf|ux|+|uy|+|uz|dt转化为每个轴的单轴性能指标

J=0tf[ρ+|u(t)|]dt,ρ0---(7)

其中,ρ为转移时间与燃料消耗的比重;

根据极小值原理,构造哈密顿函数

H=ρ+|u(t)|+λ1(t)x2(t)+λ2(t)u(t)              (8)

H为哈密顿函数,x(t)=[x1(t) x2(t)]T是状态量,λ(t)=[λ1(t) λ2(t)]T为协状态量;

此时可以得到最优控制

u*(t)=+umax,λ2*(t)<-10,-1<λ2*(t)<1-umax,λ2*(t)>1[0,+umax],λ2*(t)=-1[-umax,0],λ2*(t)=1---(9)

协态方程为

λ·1*=-Hx1*=0λ·2*(t)=-Hx2*=-λ·1*(t)---(10)

求解协态方程得

λ1*(t)=c1λ2*(t)=-c1t+c2---(11)

t为时间;u*(t)为最优主动控制量,为最优协状态,为 对时间的导数,c1、c2为常数;为J取极小值时的x1、x2,即最优 值;

哈密顿函数在终端时刻满足

H(tf*)=ρ+|u*(tf*)|+λ1*(tf*)x2*(tf*)+λ2*(tf*)u*(tf*)=0---(12)

步骤三、设计时间-燃料最优控制律并对追踪航天器进行控制:

先考查方程(10)会不会存在奇异解,假设有一段时间内有即 c1=0,c2=±1,则与式(12)矛盾,所以不存在奇异解。

当c1≠0时,有至多在两个孤立时间点上满足对应正常 情况,至多切换两次,但以0结尾的控制序列不可能实现最优控制,因为若最后一段 u*(t)=0,则由公式(6)可知,其相轨迹为一族不通过 原点的平行直线或x1轴上的若干孤立点,不能将状态转移至(x1f,0)。这样,燃料最优控 制候选序列只有可能存在如下六种:即时间-燃料最优问题存在六种候选的控制序列:

{0,+umax},{0,-umax},{+umax},{-umax},{+umax,0,-umax},{-umax,0,+umax}

首先确定x1、x2满足什么条件时,能在+umax和-umax的控制下到达终端状态(x1f,0)。 通过u*(t)分别取+umax和-umax时,相平面x1-x2上状态的运动规律来分析。

当u*(t)=+umax时,状态方程的解为

x2*(t)=x20+umaxtx1*(t)=x10+x20t+12umaxt2---(13-1)

消去时间变量t,得最优相轨迹方程

x1*(t)=12umax[x2*(t)]2+(x10-12umaxx202)---(13-2)

对于任意的初始状态x10和x20,上式表示一族开口向右的抛物线,其中,满足目标集 为状态空间中(x1f,0)的曲线对应的抛物线方程为

γ+={(x1,x2)|x1=12umaxx22+x1f,x20}---(13-3)

同理,当u*(t)=-umax时,一族开口向左的抛物线中,满足目标集的抛物线方程为

γ-={(x1,x2)|x1=-12umaxx22+x1f,x20}---(13-4)

将γ+和γ-曲线在相平面上组合成曲线γ,称为开关曲线,其方程为

γ=γ+γ-={(x1,x2)|x1=-12umaxx2|x2|+x1f}---(13)

以图3中A点初始状态为例,在最优控制序列{+umax,0,-umax}下到达F点,整个过 程在B点和C点发生两次切换,在B点处,u*(t)由+umax切换到0,而在C点处,u*(t)由0 切换到-umax,整个最优轨线分为三段,AB段,BC段,CF段。

第二次切换后运行的CF段一定位于前面所讨论的开关曲线γ-上,如式(13-4)所示。

然后确定B点位于哪条有规律的开关曲线上。

设tB,tC分别为达到点B和C的切换时间,(x1B,x2B),(x1C,x2C)分别为点B和C的坐标, 显然x2B=x2C

在BC段,u*(t)=0,由状态方程解得

x1C=x1B+x2C(tC-tB)                 (14-1)

在CF段,u*(t)=-umax,由状态方程解得

x1C=-12umaxx2C2+x1f---(14-2)

切换时刻,最优协态必须满足

λ2*(tB)=-c1tB+c2=-1λ2*(tC)=-c1tC+c2=+1---(14-3)

哈密顿函数在切换时刻必须满足

H(tB)=ρ+c1x2B=0H(tC)=ρ+c1x2C=0---(14-4)

由式(14-4)可知

c1=-ρx2B=-ρx2C---(14-5)

再由式(14-3)易得

tC-tB=-2c1=2x2Bρ---(14-6)

代入式(14-1)并由式(14-2)以及x2B=x2C整理可以得到

x1B=-ρ+4umax2umaxρx2B2+x1f---(14-7)

这就意味着切换点B点位于抛物线μ-上:

μ-={(x1,x2)|x1=-ρ+4umax2umaxρx22+x1f,x20}---(14-8)

通过类似地分析,可以得到控制序列取{-umax,0,+umax}时的另一条开关曲线μ+如下:

μ+={(x1,x2)|x1=ρ+4umax2umaxρx22+x1f,x20}---(14-9)

μ=μ+μ-={(x1,x2)|x1=-ρ+4umax2umaxρx2|x2|+x1f}---(14)

所以,在连续控制时,控制u的幅值有上限,即|u|≤umax,终端状态要求速度为零, 即各子系统要求x2f=0;求得整个时间-燃料最优相轨迹的开关曲线γ和μ,其方程为

γ=γ+γ-={(x1,x2)|x1=-12umaxx2|x2|+x1f}---(13)

μ=μ+μ-={(x1,x2)|x1=-ρ+4umax2umaxρx2|x2|+x1f}---(14)

γ+、γ-、μ+、μ-表示两条开关曲线的四个部分;x1f为x1的终端状态;

求得开关曲线γ后,依次讨论各个控制序列;即可得到开关曲线γ和控制序列的开关曲 线μ将相平面分为R1,R2,R3,R4四个区域,如图2所示,

R1={(x1,x2)|x1-12umaxx2|x2|+x1f,x1>-ρ+4umax2umaxρx2|x2|+x1f}R2={(x1,x2)|x1<-12umaxx2|x2|+x1f,x1-ρ+4umax2umaxρx2|x2|+x1f}R3={(x1,x2)|x1-12umaxx2|x2|+x1f,x1<-ρ+4umax2umaxρx2|x2|+x1f}R4={(x1,x2)|x1>-12umaxx2|x2|+x1f,x1-ρ+4umax2umaxρx2|x2|+x1f}---(15)

最终得到时间-燃料最优控制律为

u*(t)=+umax,(x1,x2)R30,(x1,x2)R2R4-umax,(x1,x2)R1---(16)

区域R2,R4的大小将随着ρ值的减小而增加;

三轴均按此时间-燃料最优控制律来对追踪航天器进行控制。

实施例

以50km到10km的最优转移为例,取[x0,y0,z0]=[24000,40000,18000]m, [xf,yf,zf]=[4800,8000,3600]m,要求末状态误差小于200m,每个坐标轴方向的连续推 力所产生的控制加速度幅值不超过0.01m/s2

基于相对运动动力学模型,在Simulink中搭建仿真模型,如图4所示,三个坐标轴 方向的控制量ux,uy,uz按式(16)所示的控制律分别设计。ρ值分别选取0.015,0.02,0.024 代表偏燃料、折中、偏时间三种情况进行仿真。

现以ρ=0.015为例,三轴方向的位置随时间变化曲线如图5所示,轨道转移的空间 轨迹如图6所示,到达末端点附近的触发时间信号如图7所示,三轴方向的控制量随时间 变化曲线如图8所示,三轴方向的状态转移轨迹如图9,图10,图11所示。

由图7可得转移时间大约为4345秒,性能指标

J=ρtf+0tf|ux|+|uy|+|uz|dt=0.015×4345+29.51+23.60+31.55=65.175+84.66=149.835---(17)

ρ=0.02和0.024时有与ρ=0.015类似的控制效果,三种情况下的转移时间及燃料消 耗情况如表1所示。

表1三种情况的转移时间和性能指标值

从表1可以看出,随看ρ值的增大,转移时间缩短,而燃料消耗增加,因为ρ值的增 大,意味着我们对性能指标中转移时间部分更加关心,从而最优控制所消耗的燃料增加, 不过转移时间减少了。

图8的三轴控制量随时间变化曲线中,到达末端位置后出现的频繁切换现象,与时间 最优控制的变化曲线中现象相同,都是随着仿真的继续,尽力将系统状态保持在末端状态 处导致的;而转移过程中出现的一小段频繁切换现象以及切换次数大于理论中最多切换两 次的现象,都是由于实际系统并非简单的双积分系统所导致的,但从相平面的状态转移轨 迹可以看出,大致符合理论的结果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号