关于带递归效用的平均场最优控制问题的随机最大值原理

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Peng[1]在1998年提出一个重要的公开问题:“除了一些特殊情形，当f非线性依赖于z时相应的全局最大值原理是一个公开问题”。[2]和[3]研究了这个公开问题，但是他们所得到的最大值原理仍包含未知参数。公开问题的主要难点在于倒向随机微分方程（简记为BSDE）的生成元f（x，y，z，u）是非线性依赖于z的，这是无论在理论还是实际生活中都存在的一种典型状态。2015年Hu[4]最终解决了这个历时已久的公开问题。在Hu[4]的基础上，本文将结论推广至平均场情形，并考虑了完全耦合的部分可观测的平均场随机最优控制问题。本文主要分为两部分。
　　第一部分，我们研究带递归效用函数的平均场最优控制问题的随机最大值原理。我们得到了带递归效用函数的平均场倒向随机微分方程(简记为MFBSDE)的变分方程，且得到了新的最大值原理。控制域不必为凸且MFBSDE的生成元可包含z。我们考虑如下状态方程:{dx(t)=b(t，x(t)，Ex(t)]，u(t))dt+σ(t，x(t)，E[x(t)]，u(t))dW(t)，(1)x(0)=x0.
　　我们定义代价泛函:J(u(·))=y(0)，(2)
　　其中y(·)为以下MFBSDE的解:dy(t)=-f(t，x(t)，E[x(t)]，y(t)，E[y(t)]，z(t)，E[z(t)]，u(t))dt+z(t)dW(t)，(3)y（T）=φ（x（T），E[x（T）]）.
　　带递归效用的平均场随机最优控制问题为在可容许控制集u[0,T]上最小化(2)式中的代价泛函J(u(·))，即找到最优控制ū，使得J(ū(·))=u(·)inf∈u[0,T]，J(u(·)).
　　我们的目的是得到最小化代价泛函时，最优控制ū(·)所能满足的条件。我们的主要思想是利用Ekeland变分原理以及相应的伴随方程得到最优控制的必要条件。本部分的主要难点在于:(1)如何得到MFBSDE的二阶变分方程的具体形式（与[15]不同）。(2)关于z的变分方程的二次形式导致二阶伴随方程十分复杂。
　　第二部分我们考虑了一种完全耦合的正倒向随机系统的部分可观测的平均场随机最优控制问题。在正向扩散系数不包含控制变量且控制域不必为凸的假设下，由Ekeland变分原理并利用针状变分法，我们得到庞特里亚金型的最大值原理，并且相关的伴随过程为平均场情形下的正倒向随机微分方程（简记为FBSDE）的解。而完全耦合的正倒向随机最优控制问题的一般最大值原理仍是一个公开问题。
　　我们定义如下代价泛函:J(u(·))=Eu[∫T0 l(t，xu(t)，E[xu(t)]，yu(t)，E[yu(t)]，zu(t)，E[zu(t)]，u(t))dt(4)+φ(xu(T)，E[xu(T)])+γ(yu(0))]，约束于受控的完全耦合的平均场FBSDE:dxu(t)=b(t，θu(t)，u(t))dt+σ(t)，θu(t))dW(t)，dyu(t)=-f(t，θu(t)，u(t))dt+zu(t)dW(t)，(5)xu(0)=x0，yu（T）=g(xu(T)，E[xu（T）]），t∈[0，T].其中θu(t)=(xu(t)，E[xu(t)]，yu(t)，E[yu(t)]，zu(t)，E[zu(t)])，以及部分观测dY(t)=h(t，xu(t)，E[xu(t)]，yu(T0，E[yu(t)],u(t))出+d(W)(t)，Y(0)=0.(6)当系数满足Lipschitz条件、可积性条件和G-单调性条件时，方程(5)存在唯一解，其中正向扩散系数不包含控制。我们应用Ekeland变分原理及相应的伴随方程得到完全耦合情形下的部分可观测的平均场随机最大值原理。

著录项

作者
陈丽诗;
展开▼
作者单位

山东大学;

展开▼
授予单位山东大学;
学科运筹学与控制论
授予学位硕士
导师姓名李娟;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类最优控制;
关键词
平均场最优控制; 带递归效用函数; 随机最大值; Ekeland变分; 伴随方程;

相似文献

中文文献
外文文献
专利

1. 带有终端限制的平均场正倒向随机时滞控制系统的最大值原理以及在平均场对策中的应用 [J] . 郝涛 . 数学年刊A辑 . 2020,第003期
2. 平均场正倒向随机控制系统的最大值原理 [J] . 李瑞敬 . 数学物理学报 . 2019,第001期
3. 一类不带线性结构的随机最优控制问题的最大值原理(英文) [J] . 王维峰 ,汪宝彬 ,杨怀奎 . 应用数学 . 2017,第2期
4. 条件平均场随机微分方程的最优控制问题 [J] . 吴霜 . 数学年刊：A辑 . 2021,第001期
5. 条件平均场随机微分方程的最优控制问题 [J] . 吴霜 . 数学年刊A辑 . 2021,第001期
6. 具有脉冲控制的最优控制问题的最大值原理 [C] . 徐一生 . 1989年控制理论及其应用年会 . 1989
7. 带约束的随机递归最优控制问题的全局最大值原理 [A] . 陈雁楠 . 2018

关于带递归效用的平均场最优控制问题的随机最大值原理

目录

摘要

著录项

相似文献

相关主题

期刊订阅