首页> 中文学位 >电梯群控系统的自适应多目标优化方法研究
【6h】

电梯群控系统的自适应多目标优化方法研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景与研究意义

1.1.1电梯群控系统的自适应多目标优化问题

1.1.2课题研究意义

1.2研究现状与课题提出

1.2.1电梯群控系统多目标优化方法的研究现状

1.2.2自适应优化方法的研究现状

1.2.3目前存在的问题

1.3研究内容与创新点

1.3.1研究内容

1.3.2创新点

第二章自适应多目标优化方法研究

2.1多目标优化函数的构造

2.2自适应多目标优化设计

2.2.1自适应多目标优化结构

2.2.2自适应多目标优化原理

2.3电梯群控系统的自适应多目标优化方法

2.3.1优化目标函数的选择

2.3.2评价函数的构造

2.3.3交通模式

2.3.4电梯群控系统的自适应多目标优化设计

2.4 小结

第三章评价函数参数优化方法研究

3.1评价函数参数优化问题的模型

3.2强化学习研究

3.2.1强化学习理论背景

3.2.2值迭代强化学习方法

3.2.3策略迭代强化学习方法

3.2.4函数逼近

3.3基于强化学习的评价函数参数优化算法

3.3.1 SARSA(λ)值迭代算法

3.3.2策略梯度算法

3.3.3 Tile coding函数逼近

3.3.4评价函数参数优化算法

3.4算法收敛性分析

3.4.1近似值迭代算法收敛性分析

3.4.2近似策略迭代算法收敛性分析

3.5小结

第四章改进的评价函数参数优化方法研究

4.1隐偏向信息学习

4.1.1隐偏向信息

4.1.2动作选择机制

4.2改进的评价函数参数优化方法

4.3算法比较

4.4小结

第五章算法设计与仿真实现

5.1仿真环境

5.2软件设计与实现

5.2.1功能结构

5.2.2算法软件设计

5.2.3程序流程

5.3仿真实验与结果分析

5.3.1仿真环境设定

5.3.2仿真运行与分析

5.4小结

第六章总结与展望

参考文献

发表论文和科研情况说明

致 谢

展开▼

摘要

本文主要研究了电梯群控系统的自适应多目标优化方法。 由于电梯群控系统重要的实际意义,其自适应多目标优化问题得到了广泛关注。电梯群控系统是一个典型的多目标系统,为探索解决问题的有效方法,论文首先系统地总结了电梯群控系统多目标优化方法。在此基础上,建立了电梯群控系统的自适应多目标优化结构,并且对结构中各组成模块的功能进行了介绍,同时详细阐述了自适应多目标优化原理。 在自适应多目标优化过程中,优化评价函数参数是解决整个问题的关键。论文以马尔可夫决策过程为背景,模型化评价函数参数优化问题,根据所研究问题的特点定义模型各要素。并且通过对自适应优化方法的总结、分析与比较,提出基于强化学习的评价函数参数优化方法,即利用强化学习的SARSA(λ)值迭代算法和策略梯度算法实现算法的迭代更新,并且将两者分别与Tile coding函数逼近相结合。然后利用随机过程、矩阵论以及不动点理论,分析证明相关算法收敛性。 针对所提出的评价函数参数优化方法存在收敛速度慢、训练时间长等问题,将隐偏向信息学习与强化学习相结合,进一步提出了改进的评价函数参数优化方法。仿真实验表明,改进方法的收敛速度明显提高,同时缩短了学习时间。 设计结合自适应多目标优化单元的电梯群控虚拟仿真环境的结构,定义各部分功能函数之间的接口。结合电梯群控虚拟仿真环境进行仿真,生成了两种不同的交通流用于算法的仿真与训练,首先分析比较两种评价函数参数优化方法在解决电梯群控系统的自适应多目标优化问题中的学习能力,然后通过与其他方法进行比较,仿真结果不仅体现了所研究的自适应多目标调度优化方法对于不同的交通模式具有较强的适应性,而且获得了综合性能更好的优化结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号