文摘
英文文摘
声明
第一章绪论
1.1研究背景与研究意义
1.1.1电梯群控系统的自适应多目标优化问题
1.1.2课题研究意义
1.2研究现状与课题提出
1.2.1电梯群控系统多目标优化方法的研究现状
1.2.2自适应优化方法的研究现状
1.2.3目前存在的问题
1.3研究内容与创新点
1.3.1研究内容
1.3.2创新点
第二章自适应多目标优化方法研究
2.1多目标优化函数的构造
2.2自适应多目标优化设计
2.2.1自适应多目标优化结构
2.2.2自适应多目标优化原理
2.3电梯群控系统的自适应多目标优化方法
2.3.1优化目标函数的选择
2.3.2评价函数的构造
2.3.3交通模式
2.3.4电梯群控系统的自适应多目标优化设计
2.4 小结
第三章评价函数参数优化方法研究
3.1评价函数参数优化问题的模型
3.2强化学习研究
3.2.1强化学习理论背景
3.2.2值迭代强化学习方法
3.2.3策略迭代强化学习方法
3.2.4函数逼近
3.3基于强化学习的评价函数参数优化算法
3.3.1 SARSA(λ)值迭代算法
3.3.2策略梯度算法
3.3.3 Tile coding函数逼近
3.3.4评价函数参数优化算法
3.4算法收敛性分析
3.4.1近似值迭代算法收敛性分析
3.4.2近似策略迭代算法收敛性分析
3.5小结
第四章改进的评价函数参数优化方法研究
4.1隐偏向信息学习
4.1.1隐偏向信息
4.1.2动作选择机制
4.2改进的评价函数参数优化方法
4.3算法比较
4.4小结
第五章算法设计与仿真实现
5.1仿真环境
5.2软件设计与实现
5.2.1功能结构
5.2.2算法软件设计
5.2.3程序流程
5.3仿真实验与结果分析
5.3.1仿真环境设定
5.3.2仿真运行与分析
5.4小结
第六章总结与展望
参考文献
发表论文和科研情况说明
致 谢