强化学习
强化学习的相关文献在1994年到2021年内共计2887篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、中国共产党
等领域,其中期刊论文1341篇、会议论文70篇、专利文献1476篇;相关期刊579种,包括电子学报、通信学报、电脑知识与技术等;
相关会议55种,包括第十二届中国智能交通年会、福建省电机工程学会第十六届学术年会、2012年第14届中国系统仿真技术及其应用学术年会等;强化学习的相关文献由7084位作者贡献,包括刘全、傅启明、余涛等。
强化学习
-研究学者
- 刘全
- 傅启明
- 余涛
- 高阳
- 伏玉琛
- 朱斐
- 张孝顺
- 王辉
- 张汝波
- 阮晓钢
- 陈世福
- 陈建平
- 章鹏
- 顾国昌
- 吴宏杰
- 孙洪坤
- 李春贵
- 洪炳镕
- 王浩
- 肖飞
- 任红格
- 俞扬
- 李瑾
- 王莉
- 王雪松
- 程玉虎
- 肖亮
- 董春利
- 钟珊
- 陈宗海
- 陈玮
- 韩伟
- 于俊
- 刘博
- 刘晓
- 刘智斌
- 吴捷
- 周倩
- 唐捷
- 孙亮
- 朱卫纲
- 李福进
- 杨旭东
- 毛晓彬
- 沈智鹏
- 王帅
- 王醒策
- 章宗长
- 翟建伟
- 赵冬斌
-
-
Zhang Wentao;
张文韬;
Wang Lu;
汪璐;
Cheng Yaodong;
程耀东
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
高能物理计算是典型的数据密集型计算,文件访问模式以跳读为主,并发度高.吞吐率、响应时间等性能对整个系统至关重要,往往是重点关注的性能优化目标.分布式存储系统存在大量可供调节的参数,这些参数的设置对系统的性能有着很大的影响.而参数调节和系统的反馈之间是有延时的,如果采取了连续多个调节动作,很难确定究竟是哪个动作起了作用,或者每个动作对结果的影响是多少.因此,人工调节不免存在偏差,况且庞大的参数搜索空间、负载的连续性、负载和设备的多样性等因素也决定了传统方法是非常低效的.实际上,如果把调节引擎看作是智能体,把存储系统看作是环境,存储系统的参数调节问题是典型的顺序决策问题.因此,基于高能物理计算的数据访问特点,提出了用强化学习的方法来进行自动化的参数调优.实验表明,在相同的测试环境下,以Lustre文件系统默认参数为基准,该方法可使其吞吐率提升30%左右.
-
-
-
王尉同;
潘毅群;
黄治钟
- 《上海制冷学会2017年学术年会》
| 2017年
-
摘要:
空调系统运行优化是建筑节能的重要组成部分.本文将强化学习算法应用在空调系统运行优化中.首先建立空调系统运行优化任务的马尔科夫决策过程模型,接下来确立规则对探索空间进行进一步缩减,使探索过程尽可能满足系统设备运行和被控区域舒适度的约束,最后应用QLearning算法探索学习不断改进控制策略.通过仿真案例对算法进行了测试.采用动态仿真软件TRNSYS和MATLAB进行联合仿真,对被控区域送风量进行了优化,仿真结果显示,与基于固定规则的控制策略和PID控制相比,本文提出的基于强化学习的控制方法可以在小幅提升被控区域舒适度的同时可将运行费用分别降低超过7%和4.5%.
-
-
Huo Yusen;
霍雨森;
Hu Jianming;
胡坚明;
Wang Guan;
王冠
- 《第十二届中国智能交通年会》
| 2017年
-
摘要:
交叉口是城市路网的核心和枢纽,也是城市通行能力的瓶颈.合理优化交通道口的信号控制可以极大地提高城市交通体系的运行效率,减少交通堵塞,是一个非常重要的研究课题.由于大范围交通信号控制属于模糊决策问题,非常适合利用强化学习方法来解决.随着深度学习技术的发展,结合深度学习和强化学习的技术——深度强化学习也在近些年出现了一种井喷的态势.本文主要介绍了主流的强化学习方法,并列举了近些年来利用强化学习进行交通信号控制的一些研究成果,阐述了这些方法是如何用于解决交通控制问题的.
-
-
-
冯陈伟
- 《福建省电机工程学会第十六届学术年会》
| 2016年
-
摘要:
为了充分利用各种无线网络的资源,需要实现异构网络的融合,而异构网络的融合又面临接入控制与资源分配的问题,提出一种基于强化学习的异构无线网络资源管理算法,该算法引入D2D(device-to-device)通信模式,并可以根据终端不同的业务类型、终端移动性及网络负载条件等状态,选择合适的网络接入方式.仿真结果表明,该算法具有高效的在线学习能力,能够有效地提升网络的频谱效用,降低阻塞率,从而实现自主的无线资源管理.
-
-
-
-