基于深度强化学习的流媒体边缘云会话调度策略

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

传统的基于CDN和P2P技术的流媒体系统存在可靠性差、扩展代价高等缺点。云计算技术的成熟使流媒体服务向云形态转变，流媒体云可以很有效地解决上述问题。将流媒体云放置在网络边缘，可以减轻核心网络的流量负载和提高用户请求的响应速度。通常情况下，流媒体边缘云系统资源是按需分配的。相比于传统流媒体服务系统，弹性的流媒体边缘云对资源调度具有更高要求。
　　目前，流媒体边缘云资源调度问题的求解方法大多是传统的启发式方法或规划方法，存在自适应性不足、时间复杂度高等问题，难以根据系统运行场景进行策略调节。强化学习以试错的机制与环境进行交互，能够自动适应复杂环境，通过使累积回报值最大的方式来学习到最优策略。因此，本文使用了强化学习方法来解决流媒体边缘云系统会话调度问题，完成的主要工作如下:
　　1)在考虑迁移代价、负载均衡等约束的前提下，提出了一种基于深度强化学习的流媒体边缘云会话调度策略。具体地，根据流媒体边缘云系统调度问题的特点，定义状态空间、动作集合、回报函数等元素，采用卷积神经网络拟合策略函数和动作-价值函数，分别解决高维输入和动作-价值函数的存储和泛化问题，通过确定性策略梯度强化学习算法来训练神经网络。
　　2)实现了深度强化学习算法，并且采用该算法进行了仿真实验。首先，搭建实验平台，编程实现基于确定性策略梯度的强化学习算法，然后根据算法流程，完成神经网络的训练。最后，进行用户请求接入的仿真实验，利用训练好的策略网络来处理用户的请求接入问题。
　　综上，本文基于深度强化学习方法实现了会话调度算法，并且进行了仿真实验来验证算法的有效性。实验结果表明，该策略能够取得很好的请求接入效果，并且降低了迁移代价，缩短了算法的运行时间。同时，算法在不确定的流媒体边缘云系统环境中具有一定的适应性。

著录项

作者
徐西建;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科控制科学与工程
授予学位硕士
导师姓名奚宏生;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类一般性问题;
关键词
流媒体边缘云; 会话调度; 深度强化学习; 确定性策略梯度;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的流媒体边缘云会话调度策略 [J] . 徐西建 ,王子磊 ,奚宏生 . 计算机工程 . 2019,第005期
2. 基于动态阈值分配的流媒体边缘云会话迁移策略 [J] . 姜同全 ,王子磊 ,奚宏生 . 计算机工程 . 2017,第001期
3. 基于深度强化学习的充光储能源站调度策略 [J] . 孙广明 ,陈良亮 ,王瑞升 . 电力工程技术 . 2021,第005期
4. 基于深度强化学习的充光储能源站调度策略 [J] . 孙广明 ,陈良亮 ,王瑞升 . 江苏电机工程 . 2021,第005期
5. 基于深度强化学习的微电网储能调度策略研究 [J] . 王亚东 ,崔承刚 ,钱申晟 . 可再生能源 . 2019,第008期
6. 基于改进的DBSCAN聚类算法的云任务调度策略研究 [C] . 王李彧 ,孙斌 . 2016年全国通信软件学术会议 . 2016
7. 流媒体边缘云的智能存储资源调度策略研究 [A] . 陈则维 . 2018

基于深度强化学习的流媒体边缘云会话调度策略

目录

摘要

著录项

相似文献

相关主题

期刊订阅