首页> 中文期刊> 《电脑编程技巧与维护》 >改进GA3C求解POMDP的深度强化学习网络模型

改进GA3C求解POMDP的深度强化学习网络模型

     

摘要

针对GA3C求解视频游戏中P OMDP问题的特点,通过引入长短期记忆(Long-Short Term Memory,LSTM)保留游戏过程中多时间步的历史状态信息,与当前状态信息一同作为输入状态信息,该网络仅需对当前的1幅游戏截图进行预处理,网络输入状态空间的规模在每个训练时间步都得以缩小,只有原来传统网络的1/4,从而可以减小更新网络所需的计算量及存储要求,加快学习速度.同时LSTM有记忆机制,改进的网络模型将有利于加强求解POMDP问题的性能.

著录项

  • 来源
    《电脑编程技巧与维护》 |2019年第4期|24-26|共3页
  • 作者

    陈晓军; 康士伟;

  • 作者单位

    三峡大学水电工程智能视觉检测湖北省重点实验室;

    湖北 宜昌443002;

    三峡大学计算机与信息学院;

    湖北宜昌443002;

    三峡大学水电工程智能视觉检测湖北省重点实验室;

    湖北 宜昌443002;

    三峡大学计算机与信息学院;

    湖北宜昌443002;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    GA3C求解; POMDP问题; 学习网络模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号