首页> 中国专利> 一种基于注意力特征融合的自适应阈值场景文本检测方法

一种基于注意力特征融合的自适应阈值场景文本检测方法

摘要

本发明涉及一种基于注意力特征融合的自适应阈值场景文本检测方法,包括,通过设备捕捉场景图片,将场景图片输入到构建好的神经网络中,神经网络包括三个处理模块;特征提取模块用于对图片进行特征提取,其中卷积层加入的通道注意力模块能够动态调制图片各通道的权重,通过增强文本特征权重来提高网络的表示能力,特征融合将特征提取模块中下采样得到的不同尺度的的特征进行金字塔方式的特征融合,融合了低层特征的高分辨率和高层特征的语义信息,提高了分割的鲁棒性。图像分割模块是将特征融合模块得到的特征进行预测得到概率图和阈值图,在通过网络中学习概率图像素的最佳阈值,最后在概率图上利用最佳阈值生成最佳二值图,得到检测的文本区域。

著录项

  • 公开/公告号CN113516126A

    专利类型发明专利

  • 公开/公告日2021-10-19

    原文格式PDF

  • 申请/专利权人 成都信息工程大学;

    申请/专利号CN202110750847.1

  • 发明设计人 胡靖;雷小唐;王小龙;吴锡;

    申请日2021-07-02

  • 分类号G06K9/32(20060101);G06K9/34(20060101);G06K9/38(20060101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06T7/13(20170101);G06T7/136(20170101);

  • 代理机构51313 成都智涌知识产权代理事务所(普通合伙);

  • 代理人魏振柯

  • 地址 610200 四川省成都市西南航空港经济开发区学府路1段24号

  • 入库时间 2023-06-19 12:54:37

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号