首页> 中文学位 >基于深度学习的手写英文字母识别算法研究
【6h】

基于深度学习的手写英文字母识别算法研究

代理获取

目录

完整封面

论文正文最终版

展开▼

摘要

深度学习技术是机器学习领域的一个重要子学科,其前身是神经网络。近年来,由于技术的突破,深度学习在计算机视觉、自然语言处理、机器翻译、无人驾驶还有机器人等人工智能相关领域都取得了很好的成绩。图像识别也是深度学习技术中一个十分重要的研究领域。它和其它的深度学习领域一样都需要面对过拟合和计算效率这两个难题。 本文研究深度学习技术和卷积神经网络在图像识别领域的计算效率问题。虽然对于目前绝大多数的图像识别任务,在有足够数据的情况下,只要增加模型的复杂度,使用更多的计算资源或者更强大的专业计算设备,就可以使精度得到提升。但在许多现实情况中,例如在机械工程应用中,可以把这种基于神经网络的深度学习算法应用到工业机器人的图像识别算法上,利用该算法进行商品或者零件的分拣。而工业机器人中可利用的计算资源是有限的,限制了应用中能够使用的模型的复杂度。需要提高计算效率,降低参数的数量,才可能将其应用到更多的实际场景中。 为了提高计算效率,本文基于多分支的Inception结构,提出了一种Inception结构的变体,利用它构成了深度卷积神经网络,并取得了较好的分类效果和较高的计算效率。本文的主要内容如下: 1.通过对比实验,确定Inception所代表的多分支结构能获得比VGGNet所代表的直线型结构更好的结果。 2.通过对Inception原型结构中的卷积核进行拆分,删除部分拆分后的卷积核,然后将剩余的卷积核重新安排到不同分支中的方式,提出了Inception结构的变体。在堆叠Inception变体结构,构建完整卷积神经网络时,适当增加了一些其他层级并调整了一些超参数。在和原型的对比实验中得到以下结果:第一,在相同的软、硬件环境下,且输入也完全相同时,针对手写英文字母数据集,变体结构能够获得92%以上的训练精度和87%以上的验证精度,略微优于原型的实验精度;第二,因为Inception变体结构所包含的参数比原型少,所以它的计算效率更高,平均每个批次的训练时间比原型减少14.898%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号