首页> 中文期刊>小型微型计算机系统 >融合时空特征的视觉自动驾驶强化学习算法

融合时空特征的视觉自动驾驶强化学习算法

     

摘要

基于视觉的自动驾驶任务挑战主要来自环境信息维度高和训练数据分布偏差大2个方面.针对环境信息维度高的挑战,融合时空特征的视觉自动驾驶算法(Space-Time Reinforce Learning Auto Driving,简称STRLAD)使用双流网络络进行特征提取,包含(ⅰ)感知网络:从摄像头中低速抽取RGB图片作为输入,完成图片整体特征提取;(ⅱ)运动网络:从视频中高速获取灰度图作为输入,完成物体运动特征提取;(ⅲ)感知网络和运动网络在各个特征层使用注意力机制进行融合,完成对环境的特征表示.针对训练数据分布偏差的问题,STRLAD算法以双流网络提取的特征为输入,使用Soft Actor-Critic算法学习驾驶策略,缓解数据偏差和泛化问题.STRLAD算法使用CARLA模拟器进行训练和验证,实验结果表明STRLAD算法能够在复杂的城市尤其多动态物体的环境中能够完成自动驾驶,完成率达到89%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号