像素聚合和特征增强的任意形状场景文本检测

师广琛; 巫义锐

首页> 中文期刊>中国图象图形学报 >像素聚合和特征增强的任意形状场景文本检测

像素聚合和特征增强的任意形状场景文本检测

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目的获取场景图像中的文本信息对理解场景内容具有重要意义,而文本检测是文本识别、理解的基础.为了解决场景文本识别中文字定位不准确的问题,本文提出了一种高效的任意形状文本检测器:非局部像素聚合网络.方法该方法使用特征金字塔增强模块和特征融合模块进行轻量级特征提取,保证了速度优势;同时引入非局部操作以增强骨干网络的特征提取能力,使其检测准确性得以提高.非局部操作是一种注意力机制,能捕捉到文本像素之间的内在关系.此外,本文设计了一种特征向量融合模块,用于融合不同尺度的特征图,使尺度多变的场景文本实例的特征表达得到增强.结果本文方法在3个场景文本数据集上与其他方法进行了比较,在速度和准确度上均表现突出.在 ICDAR(International Conference on Document Analysis and Recognition)2015数据集上,本文方法比最优方法的F值提高了0.9％,检测速度达到了23.1帧/s;在CTW(Curve Text in the Wild)1500数据集上,本文方法比最优方法的F值提高了1.2％,检测速度达到了71.8 帧/s;在Total-Text数据集上,本文方法比最优方法的F值提高了1.3％,检测速度达到了34.3帧/s,远远超出其他方法.结论本文方法兼顾了准确性和实时性,在准确度和速度上均达到较高水平.

著录项

来源
《中国图象图形学报》|2021年第7期|1614-1624|共11页
作者
师广琛; 巫义锐;
展开▼
作者单位

河海大学计算机与信息学院南京 211100;

河海大学计算机与信息学院南京 211100;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
目标检测; 场景文本检测; 神经网络; 非局部模块; 像素聚合; 实时检测; 任意形状;

相似文献

中文文献
外文文献
专利

1. 基于分割的任意形状场景文本检测 [J] . 蔡鑫鑫 ,王敏 . 计算机系统应用 . 2020,第012期
2. 双向特征融合的快速精确任意形状文本检测 [J] . 边亮 ,屈亚东 ,周宇 . 电子与信息学报 . 2021,第004期
3. 基于多边形偏移蒙版和边界增强的场景文本检测 [J] . 张智 ,秦瑶 ,顾进广 . 计算机应用研究 . 2021,第008期
4. 结合多粒度特征融合的自然场景文本检测方法 [J] . 陈卓 ,王国胤 ,刘群 . 计算机科学 . 2021,第012期
5. 自然场景图像中的文本检测及定位算法研究——基于边缘信息与笔画特征 [J] . 李东勤 ,徐勇 ,周万怀 . 重庆科技学院学报（自然科学版） . 2019,第003期
6. 一种基于多特征融合的场景文本检测方法 [C] . Xiao Chengqiu ,肖诚求 ,Ji Lixin . 第17届全国图象图形学学术会议 . 2014
7. 基于图像增强的多特征自然场景文本检测研究 [A] . 陈硕 . 2018

像素聚合和特征增强的任意形状场景文本检测

摘要

著录项

相似文献

相关主题

期刊订阅