技术领域
本发明涉及无人机自主避障领域,具体为一种基于深度学习和双目视觉的无人机自主避障方法.
背景技术
无人机的避障性能是决定其应用性能的核心因素之一。应用单一传感器的避障方法存在鲁棒性差、有效性低、可靠性差、环境适应性弱等问题。目前,一般使用基于多传感器信息融合的避障和定位方法,能够保证侦测无人机在不同环境条件下最大程度地感知周围信息。但超声波雷达、毫米波雷达、激光测距仪等难以完成周围环境的详细描述,进行避障具有一定局限性。采用视觉模块通过相机标定,立体匹配,三维重建和路径规划等多个步骤虽然可以实现自主避障,但步骤较为繁琐。
因此本发明考虑将发展迅速的计算机视觉技术应用于无人机自主避障过程,利用双目相机和轻量级的卷积神经网络实现端到端的预测过程,在实现较高精确度的条件下大大简化了自主避障的过程。
发明内容
本发明的目的在于提供一种基于深度学习和双目视觉的无人机自主避障方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习和双目视觉的无人机自主避障方法,包括以下步骤:
S1:在多个真实场景下如墙壁、树木、行人等场景下进行手动操作避障;
S2:对左右相机的图像进行处理,以及在避障时无人机瞬时的俯仰角θ、滚转角
S3:在卷积神经网络经过训练后搭载到无人机上,最终实现端到端的无人机自主避障过程。
优选的,在所述S3步骤中卷积神经网络设计为输入为224×224×3的图像,经过归一化以及以卷积网络之后,输出为预测的俯仰角θ、滚转角
优选的,所述输出的俯仰角θ、滚转角
优选的,在所述S2步骤中的图像处理中,无需对图像中的障碍物进行任何的标注,主要是对图像进行归一化处理和数据增强,归一化的主要公式为
所述数据增强为通过对原始图片的变换来提高模型的鲁棒性与泛华能力,因此,通过水平翻转、随机裁剪、平移、加噪的方式进行数据增强,其中水平翻转时,植保无人机的滚转角也进行相应的翻转以保持数据的对应。
与现有技术相比,本发明的有益效果是:本发明将计算机视觉技术应用于无人机避障领域,并通过双目相机和轻量级的卷积神经网络实现端到端的预测过程,以达到在保证精确度的前期下简化现有无人机的自主避障过程的目的。
附图说明
图1为本发明中图像输入至卷积神经网络的流程图;
图2为本发明中卷积神经网络的设计图;
图3为本发明中实现正向预测的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
如图1-3;本发明提供一种基于深度学习和双目视觉的无人机自主避障方法,包括以下步骤:
S1:在多个真实场景下如墙壁、树木、行人等场景下进行手动操作避障;
S2:对左右相机的图像进行处理,以及在避障时无人机瞬时的俯仰角θ、滚转角
S3:在卷积神经网络经过训练后搭载到无人机上,最终实现端到端的无人机自主避障过程。
进一步的,在所述S3步骤中卷积神经网络设计为输入为224×224×3的图像,经过归一化以及以卷积网络之后,输出为预测的俯仰角θ、滚转角
进一步的,所述输出的俯仰角θ、滚转角
进一步的,在所述S2步骤中的图像处理中,无需对图像中的障碍物进行任何的标注,主要是对图像进行归一化处理和数据增强,归一化的主要公式为
所述数据增强为通过对原始图片的变换来提高模型的鲁棒性与泛华能力,因此,通过水平翻转、随机裁剪、平移、加噪的方式进行数据增强,其中水平翻转时,植保无人机的滚转角也进行相应的翻转以保持数据的对应。
本发明的目的就是利用深度学习技术简化信息的处理和决策过程。无人机在手动飞行过程中遇到障碍物时,飞手通过操控遥控器给出无人机期望的俯仰角θ、滚转角
而卷积神经网络的设计如附图2所示,包括卷积层和全连接层。
激活函数的选取:ELU激活函数兼具Sigmoid激活函数和ReLU激活函数的优点,能缓解梯度消失,且具有软饱和性,鲁棒性强,受输入中噪声的影响小,且收敛速度更快,因此选用ELU为激活函数。
损失函数设计:训练过程中,卷积神经网络的输出(θ,
因此卷积神经网络的损失函数为:
其中俯仰角θ、滚转角
得到训练好的网络权重后,加载到无人机上实现左右图像的正向预测,如附图3所示,左右摄像头图像经过卷积神经网络之后得到预测值,得到的预测值经过数据筛选及融合之后传给无人机飞控,调整电机的转速,实现无人机自主避障过程。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
机译: 一种用于测量双目视觉的方法,一种用于测量双目视觉的程序,一种设计眼镜镜片的方法以及一种用于制备眼镜镜片的方法
机译: 基于多模态深度学习的无人机视频美学质量评价方法
机译: 基于深度学习姿态估计的无人机交互装置和方法