首页> 外文会议>IEEE International Conference on Image Processing >Learning bottom-up text attention maps for text detection using stroke width transform
【24h】

Learning bottom-up text attention maps for text detection using stroke width transform

机译:学习自下而上的文本注意图,以使用笔触宽度变换进行文本检测

获取原文

摘要

Humans have a remarkable ability to quickly discern regions containing text from other noisy regions in images. The primary contribution of this paper is to learn a model to mimic this behavior and aid text detection algorithms. The proposed approach utilizes multiple low level visual features which signify visually salient regions and learns a model to eventually provide a text attention map which indicates potential text regions in images. In the next stage, a text detector using stroke width transform only focusses on these selective image regions achieving dual benefits of reduced computation time and better detection performance. Experimental results on the ICDAR 2003 text detection dataset demonstrate that the proposed method outperforms the baseline implementation of stroke width transform, and the generated text attention maps compare favorably with human fixation maps on text images.
机译:人类具有非凡的能力,可以快速分辨图像中其他嘈杂区域中包含文本的区域。本文的主要贡献是学习一种模仿此行为的模型并帮助文本检测算法。所提出的方法利用了表示视觉上显着区域的多个低级视觉特征,并且学习了一种模型以最终提供指示文本图像中潜在文本区域的文本注意图。在下一阶段,使用笔划宽度变换的文本检测器仅关注这些选择性图像区域,从而获得了减少计算时间和更好的检测性能的双重好处。在ICDAR 2003文本检测数据集上的实验结果表明,该方法优于笔划宽度变换的基线实现,并且生成的文本注意图与文本图像上的人类注视图相比具有优势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号