首页> 中文期刊> 《微电子学与计算机》 >面向自然场景的中文文本检测

面向自然场景的中文文本检测

         

摘要

随着深度学习的发展,自然场景的文本检测取得了进步,但多方向和弯曲中文文本检测效果仍不理想.针对多方向和弯曲中文文本的检测问题,提出一种融合注意力机制的多尺度文本检测方法.为了平衡模型准确性和降低计算复杂度,采用轻量级Resnet18为主干网络.针对特征金字塔(FPN)提取的特征分布不确定性的问题,嵌入平衡注意力机制(BAM)提取有效文本特征并抑制低效特征通道,进而提升检测方法的鲁棒性.针对空洞空间金字塔池化网络(ASPP)下采样时图像局部信息和细节信息丢失的问题,改进ASPP以降低特征图分辨率的损失.针对FPN提取特征不足以及感受野小的问题,将嵌入注意力机制的FPN和改进的ASPP并行增强特征提取融合.针对正负样本的不平衡性的问题,基于可微二值化模块在二值图损失中引入对数化的AC Loss,从而增强检测模型的泛化能力.在公开数据集MSRA-TD500上的实验结果表明,该算法与目前快速高效的DBnet相比,准确率、召回率和F值分别提升0.1%、1.4%和0.6%,并且该算法的检测速率也有较好表现.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号