声明
摘要
本论文专用术语的注释表
第一章 绪论
1.1 研究背景
1.2 问题提出及国内外研究现状
1.2.1 研究问题与动机
1.2.2 国内外研究现状
1.3 研究内容
1.4 论文结构
第二章 Web服务组合概述
2.1 Web服务
2.1.1 Web服务协议栈
2.1.2 常用Web服务标准和技术
2.2 Web服务组合
2.2.1 Web服务组合方法
2.3 Web服务质量
2.4 本章小结
第三章 强化学习与Skyline计算
3.1 强化学习
3.2 马尔可夫决策过程
3.2.1 MDP典型求解方法
3.3 强化学习经典算法
3.3.1 时序差分(Temporal Difference,TD)算法
3.3.2 Q学习算法(Q-Learning)
3.4 多目标强化学习(Multi-Objective Reinforcement Learning,MORL)
3.5 Skyline计算
3.6 本章小结
第四章 基于多目标强化学习与Skyline计算的服务组合模型
4.1 场景描述
4.2 模型建立
4.2.1 基于多目标马尔可夫决策过程的服务组合
4.2.2 评价函数
4.2.3 策略选择
4.3 求解方法
4.3.1 单策略方法
4.3.2 多策略方法
4.4 本章小结
第五章 实验与分析
5.1 实验设置
5.2 单策略服务组合方法实验分析
5.2.1 验证有效性实验
5.2.2 验证自适应性实验
5.2.3 验证可扩展性实验
5.3 多策略服务组合方法实验分析
5.3.1 验证有效性实验
5.3.2 验证自适应性实验
5.3.3 验证可扩展性实验
5.4 本章小结
第六章 总结与展望
6.1 本文总结
6.2 未来工作
致谢
参考文献
附录A 攻读硕士期间发表的论文
东南大学;