声明
摘要
本论文专用术语的注释表
第一章 绪论
1.1 研究背景
1.2 问题提出及现有方法
1.3 研究内容
1.4 论文组织
第二章 Web服务及服务组合技术概述
2.1 Web服务概述
2.1.1 Web服务协议
2.1.2 Web服务核心标准和技术
2.2 服务综合技术概述
2.2.1 web服务组合需求
2.2.2 web服务组合方法分类
2.3 本章小结
第三章 强化学习相关理论
3.1 马尔科夫决策过程
3.1.1 MDP最优策略和值函数
3.1.2 MDP的求解
3.2 强化学习方法
3.2.1 强化学习算法相关重要问题
3.2.2 探索策略
3.2.3 函数逼近技术
3.3 本章小结
第四章 基于强化学习的QoS感知的服务组合模型及优化方案
4.1 Web服务组合模型MDP-WSC
4.1.1 评价函数
4.1.2 离策略选择
4.2 基于探索的强化学习组合算法优化
4.2.1 基于回访频率的直接探索策略
4.2.2 学习率控制
4.2.3 基于直接探索优化的服务组合Q-learning算法
4.3 基于核函数的强化学习组合算法优化
4.3.1 高斯过程
4.3.2 高斯过程建模的Q值函数评估
4.3.3 在线构造稀疏字典
4.3.4 序列化高斯过程参数更新
4.3.5 基于高斯过程的在线Q-learning组合算法
4.4 本章小结
第五章 实验与分析
5.1 实验设置
5.2 有效性验证实验
5.3 自适应性验证实验
5.4 可扩展性验证实验
5.5 本章小结
第六章 总结与展望
6.1 本文总结
6.2 未来工作
致谢
参考文献
攻读硕士期间发表的论文