随机最优控制
随机最优控制的相关文献在1991年到2022年内共计135篇,主要集中在自动化技术、计算机技术、财政、金融、经济计划与管理
等领域,其中期刊论文116篇、会议论文16篇、专利文献1452249篇;相关期刊91种,包括管理工程学报、管理科学学报、中国科技奖励等;
相关会议15种,包括第八届全国随机振动理论与应用学术会议暨第一届全国随机动力学学术会议、全国第一届防灾减灾工程学术研讨会、International Conference on Engineering and Business Management2010(EBM2010)(2010年工程和商业管理国际会议)等;随机最优控制的相关文献由215位作者贡献,包括刘海龙、应祖光、朱位秋等。
随机最优控制—发文量
专利文献>
论文:1452249篇
占比:99.99%
总计:1452381篇
随机最优控制
-研究学者
- 刘海龙
- 应祖光
- 朱位秋
- 彭勇波
- 李杰
- 荣喜民
- 余涛
- 吴冲锋
- 朱其新
- 祝长生
- 翟玉玲
- 胡寿松
- 赵希人
- 陈拥军
- 余跃庆
- 倪一清
- 卞伟伟
- 周斌
- 周渊
- 宋轶民
- 张强
- 张笑怡
- 张策
- 张芬
- 彭秀艳
- 杨招军
- 樊治平
- 潘德惠
- 王源昌
- 王雨薇
- 胡世培
- 薛玉珍
- 贾森·D·戴克斯特拉
- 赵慧
- 辛振芳
- 邓茂林
- 邹立华
- 邹辉文
- 雷丹
- 靳艳飞
- 高赞明
- 黄志龙
- Leng Xiaolei
- Sun Yanjun
- ZHANG HaiSen12
- ZHANG Xu2
- 丁灯
- 严佳伟
- 乔若羽
- 任倩
-
-
王雨薇;
荣喜民;
赵慧
-
-
摘要:
研究了以破产概率最小化为目标的模糊厌恶型保险人的最优投资再保险问题。假设保险人可购买比例再保险,同时可投资于一个风险资产。保险人的盈余过程由扩散风险模型描述,风险资产的价格过程由常方差弹性(CEV)模型描述。根据动态规划原理建立了优化问题相应的HJB方程,针对特殊的弹性系数给出了保险人的最优鲁棒投资再保险策略的解析解。最后,通过数值模型分析了模型参数对最优投资-比例再保险策略和值函数的影响。研究发现保险人的模糊厌恶程度越高,其采取的投资再保险策略呈现出越保守的特点。
-
-
王鹏飞;
王安格;
宗恒山;
关宏志;
刘鹏;
徐秋实;
李松
-
-
摘要:
本研究的主要目的是确定城市道路新建和养护的动态最优投资分配策略。为此,本文以宏观视角构建了含有随机项的连续时间最优控制模型以实现城市所有用户出行成本的最小化。本文利用动态规划原理推导出随机最优控制问题的最优性条件:哈密尔顿-雅克比-贝尔曼方程,得到含有偏导数项的动态最优投资策略,同时对动态最优投资策略与状态变量、各参数之间的关系进行了定性分析。本文采用一种估计最优值函数中参数的方法求解得到动态最优投资策略的解析解,此解析解中只含有各状态变量与参数。最后,本文以实际数据为例,给出了2019-2028年的城市道路新建和养护的动态最优投资策略,并通过蒙特卡洛试验对其与现行投资策略的效率进行定量比较分析。本文通过理论及数值分析得到以下重要结论:(1)动态最优投资策略为一个闭环的反馈控制,即最优策略是路网流量与路网容量两个状态变量的函数。(2)动态最优投资策略在理论上不能保证在一次独立试验中得到的出行成本一定是最小的,因为管理者只能把握随机变量的特征,即期望值与标准差,而并不能准确预知下一年度的实际情况。(3)引入社会贴现率后的最优值函数参数估计方法将会拥有更大的适用范围。(4)在案例分析中,通过10000次的蒙特卡洛试验对动态最优投资策略与现行投资策略进行对比分析可知,动态最优投资策略可降低所有用户1414.1466万元/天的出行成本,同时动态最优投资策略的占优比例为100%。
-
-
-
张巍;
应曌中;
应祖光
-
-
摘要:
结构系统的随机振动控制是一个重要实际问题,最优限界跳变控制是一个常用的简便方法,控制界限与跳变频率是决定非连续跳变控制效果的主要因素.然而,控制效果是否随控制界限增大单调地提高、跳变频率如何影响控制作用或控制效果、两者之间具有何种制约关系等,这些限界跳变控制的关键问题尚未有结果.以随机最优限界跳变控制的界限与跳变频率关于控制效果的作用机制为研究对象,为该控制设计与优化提供理论基础.首先介绍非连续最优限界跳变控制,基于随机动态规划原理建立随机最优控制的动态规划方程,结合控制界限约束条件,确定最优界限跳变控制律的一般表达式;再对于最优控制的随机振动系统,推导响应协方差方程的一般式,分析控制界限与跳变频率对控制效果的影响;进一步以单自由度随机振动系统为例,给出最优界限跳变控制律与随机响应协方差的表达式,讨论控制界限与跳变频率对于控制效果的作用机制,并通过数值结果说明两者对于控制效果的影响规律,最终得到随机振动控制效果随跳变频率提高而提高,但随控制界限增大先提高后降低的结论.
-
-
张笑怡
-
-
摘要:
近年来,老龄化风险在金融数学和金融工程领域引起了人们极大的关注.为了对冲老龄化风险,老龄化债券在金融市场上应运而生.为了研究老龄化债券是否能有效地对冲固定缴款养老金账户所面临的老龄化风险,本文分别对累积阶段和分配阶段的固定缴款养老金进行了随机最优管理问题的研究.在两个阶段中,最优控制的目标都是通过对金融市场上老龄化债券、零息票债券和无风险资产的投资来最大化终端财富值的期望效用.应用动态规划原理并通过解相应的HJB方程,本文分别得到了两个阶段的最优投资策略的显式表达.在合理的假设前提下,结果表明无论是在累积阶段还是在分配阶段,对老龄化债券的投资都有利于提高投资效果,并最终得到更高的财富值的期望效用.
-
-
王雨薇;
荣喜民
-
-
摘要:
在模型不确定条件下,研究以破产概率最小化为目标的模糊厌恶型保险公司的最优投资再保险问题.假设保险公司可投资于一种风险资产,也可购买比例再保险.分别考虑风险资产的价格过程服从随机波动率模型和非随机波动率模型的两种情况,根据动态规划原理建立相应的HJB方程,得到保险公司的最优鲁棒投资再保险策略和价值函数的解析解.最后,通过数值模拟分析了各模型参数对最优策略和价值函数的影响.
-
-
方勇纯;
朱威;
郭宪
-
-
摘要:
路径积分方法源于随机最优控制,是一种数值迭代方法,可求解连续非线性系统的最优控制问题,不依赖于系统模型,快速收敛.文中将基于路径积分强化学习的策略改善方法用于蛇形机器人的目标导向运动.使用路径积分强化学习方法学习蛇形机器人步态方程的参数,不仅可以在仿真环境下使蛇形机器人规避障碍到达目标点,利用仿真环境的先验知识也能在实际环境下快速完成相同的任务.实验结果验证方法的正确性.
-
-
-
张笑怡1;
郭军义1
-
-
摘要:
本文研究了在通货膨胀环境下关于累积阶段的固定缴费(de?ned contribution,DC)养老金的一个均值-方差问题.一般来说,DC养老金的管理周期比较长,所以,本文考虑了养老金的实际财富过程,而非名义财富过程,并且假设价格指数的动态过程包含一个跳-扩散过程.通过投资金融市场上的三种产品(无风险银行账户、通胀指数债券和风险资产),该DC养老金最优管理的目标是在给定期望的前提下最小化终端时间的方差.风险资产同样包含一个跳-扩散过程.通过解相关的Hamilton-Jacobi-Bellman(HJB)方程,本文得到了最优的投资策略以及相关的有效前沿的显式表达.
-
-
-
-
摘要:
2018年度山东省科学技术奖励共计授奖195项(人),具体授奖情况如下:授予青岛海洋科学与技术国家实验室发展中心吴立新院士省科学技术最高奖;授予“随机最优控制和正倒向随机微分方程及其应用”等24项成果山东省自然科学奖,其中一等奖3项、二等奖17项、三等奖4项;授予“新型无氯氟聚氨酯化学发泡剂创制”等13项成果山东省技术发明奖,其中一等奖3项、二等奖7项、三等奖3项;授予“广适高产稳产小麦新品种鲁原502的选育与应用”等157项成果山东省科学技术进步奖,其中一等奖34项、二等奖79项、三等奖44项。本年度授奖项目质量明显提升,科技奖励的激励引导作用更加突出。
-
-
-
-
-
-
-
- 《中国运筹学会第九届学术交流会》
| 2008年
-
摘要:
本文把离散半方差模型投资组合问题,推广到连续时间情形.引进恰当的状态约束,将原问题简化为一个有状态约束的随机最优控制问题.利用经典Lagrange理论,将其进二步转化为无约束随机LQ最优控制问题.进而借助优化技术计算半方差模型投资组合问题的最优投资决策.
-
-
-
-
武翠琴;
李艾华;
张振仁
- 《第26届中国控制会议》
| 2007年
-
摘要:
针对多输入多输出(MIMO)网络化控制系统,分析了控制器的不同工作方式对网络时延的影响,建立了传感器节点,为时间驱动、控制器节点和执行器节点。为事件驱动时的离散时间数学模型,设计了满足给定离散性能指标的随机最优状态控制器,该控制器能使网络化控制系统均方指数稳定。仿真结果表明了本方法的有效性。
-
-
武翠琴;
李艾华;
张振仁
- 《第26届中国控制会议》
| 2007年
-
摘要:
针对多输入多输出(MIMO)网络化控制系统,分析了控制器的不同工作方式对网络时延的影响,建立了传感器节点,为时间驱动、控制器节点和执行器节点。为事件驱动时的离散时间数学模型,设计了满足给定离散性能指标的随机最优状态控制器,该控制器能使网络化控制系统均方指数稳定。仿真结果表明了本方法的有效性。