首页> 中国专利> 一种基于深度学习的自然场景下文本检测方法

一种基于深度学习的自然场景下文本检测方法

摘要

本发明提供了一种基于深度学习的自然场景下的文本检测方法,属于计算机视觉领域。该文本检测方法具体由起始模块、字符区域识别网络与胶囊筛选分类网络组成。首先起始模块降低了网络的参数,且在同一层卷积层中放入不同尺寸的卷积核,从而增强了网络对不同尺度的字符特征的适应能力。然后使用字符区域识别网络检测出图片中单个字符,再利用胶囊分类网络来对检测出来的单字符进行筛选分类,用以判断检测到的是否为字符。最后通过一种基于多特征图融合与空洞卷积的字符拼接方法将单个字符拼接成文本行。与现有技术相比,本发明可以降低字符的方向、大小以及位置等因素对检测结果的影响,从而确保检测字符的正确率,进一步提高鲁棒性和准确性。

著录项

  • 公开/公告号CN112070174A

    专利类型发明专利

  • 公开/公告日2020-12-11

    原文格式PDF

  • 申请/专利权人 上海海事大学;

    申请/专利号CN202010955696.9

  • 发明设计人 刘晋;王恒阳;

    申请日2020-09-11

  • 分类号G06K9/62(20060101);G06K9/34(20060101);G06N3/04(20060101);

  • 代理机构31332 上海互顺专利代理事务所(普通合伙);

  • 代理人成秋丽

  • 地址 201306 上海市浦东新区临港新城海港大道1550号

  • 入库时间 2023-06-19 08:06:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-10

    发明专利申请公布后的撤回 IPC(主分类):G06K 9/62 专利申请号:2020109556969 申请公布日:20201211

    发明专利申请公布后的撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号