基于强化学习的多阶段网络分组路由方法

高远翔; 罗龙; 孙罡

首页> 中文期刊>电子科技大学学报 >基于强化学习的多阶段网络分组路由方法

基于强化学习的多阶段网络分组路由方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

多阶段网络被广泛应用于机器学习集群,由于多阶段网络中可用路径多,分组的路由是一个组合优化难题。现有基于启发式的路由算法由于缺乏性能保证,严重影响分组传输延迟。提出了基于强化学习的多阶段网络分组路由方法,使用一个新颖的策略迭代算法,通过学习的方式计算出最佳路由策略。算法通过在策略评估步骤中使用价值函数的最大似然估计器,克服了强化学习方法中蒙泰卡罗(MC)或时间差分(TD)价值估计器样本效率低的问题。为了应对组合优化时计算复杂度高的问题,算法在策略改进步骤中将组合动作空间上的优化分解为各组成动作的序列优化,以提高求解效率。基于NS-3网络模拟器的仿真实验结果表明,相较于现有最优的启发式路由策略,该算法学习到的路由策略降低了13.9%的平均分组延迟。

著录项

来源
《电子科技大学学报》|2022年第2期|200-206|共7页
作者
高远翔; 罗龙; 孙罡;
展开▼
作者单位

电子科技大学光纤传感与通信教育部重点实验室;

展开▼
原文格式 PDF
正文语种 chi
中图分类通信网;
关键词
集群网络; 策略迭代; 分组路由; 强化学习;
入库时间 2022-09-15 21:44:42

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习方法的无线多跳网络能量高效机会路由 [J] . 靳晓晗 ,岩延 ,张宝贤 . 中国科学院大学学报 . 2022,第3期
2. 容迟网络中基于节点间亲密度的分组路由方法 [J] . 王恩 ,杨永健 ,赵卫丹 . 通信学报 . 2014,第012期
3. 基于深度强化学习的移动Ad Hoc网络路由选择 [J] . 朱凡芃 ,朱磊 ,姚昌华 . 通信技术 . 2020,第008期
4. 一种基于多 Agent 强化学习的无线传感器网络多路径路由协议 [J] . 乔阳 ,唐昊 ,程文娟 . 合肥工业大学学报（自然科学版） . 2016,第007期
5. 交通信息采集传感器网络基于强化学习的路由 [J] . 杨军 ,张和生 ,潘成 . 电子测量与仪器学报 . 2012,第12期
6. 一种基于分组的P2P网络安全路由算法 [C] . 徐鹤 ,王汝传 ,韩志杰 . 第三届江苏计算机大会 . 2008
7. 基于强化学习的容迟网络路由算法的研究 [A] . 袁凡 . 2020

基于强化学习的多阶段网络分组路由方法

摘要

著录项

相似文献

相关主题

期刊订阅