文本检测
文本检测的相关文献在2000年到2023年内共计787篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、数学
等领域,其中期刊论文176篇、会议论文7篇、专利文献1124421篇;相关期刊109种,包括中国图象图形学报、电脑知识与技术、计算机工程与设计等;
相关会议7种,包括第九届中国多智能体系统与控制会议(MASC2013)、中国教育和科研计算机网CERNET第十八届学术年会、中国自动化与信息技术研讨会暨2004年学术年会等;文本检测的相关文献由1677位作者贡献,包括秦勇、李兵、姚锟等。
文本检测—发文量
专利文献>
论文:1124421篇
占比:99.98%
总计:1124604篇
文本检测
-研究学者
- 秦勇
- 李兵
- 姚锟
- 章成全
- 张子浩
- 李宏亮
- 白翔
- 邹北骥
- 余英林
- 刘军
- 周宇
- 姚聪
- 李朝晖
- 谢洪涛
- 金连文
- 钦夏孟
- 陈曦
- 刘光辉
- 刘霄
- 卜巍
- 吴慧
- 孟月波
- 徐胜军
- 杨家博
- 熊泽法
- 王润民
- 王琦
- 石德旺
- 邬向前
- 金丹
- 麻文华
- 乔宇
- 代建华
- 侯栋梁
- 刘义江
- 刘莹莹
- 单鼎一
- 吕鹏原
- 吴彦巧
- 周康明
- 姜敬
- 姜琳琳
- 师孜晗
- 张勇东
- 李云超
- 李华
- 李盼盼
- 李超
- 杨青
- 檀小亚
-
-
高刘雅;
孙冬;
高清维;
卢一相;
黄志祥;
吴丹
-
-
摘要:
为解决目前驾驶证打印中复杂纹理以及原始文字背景条件的限制,提出一种基于改进连接文本提议网络(CTPN)的文本信息完整性检测方法。通过引入帧间差分的方法,先对图像作背景擦除;然后对帧差后的图像进行CTPN文本信息检测,同时引入非极大值抑制(NMS)算法提高检测框的精度。对比未经过背景擦除的图像文本检测结果,实验表明:该方法在驾驶证文本检测中具有更好的文本信息检测效果。
-
-
李云洪;
闫君宏;
胡蕾
-
-
摘要:
自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全局特征融合,对恒等残差块进行改进实现局部细粒度特征融合,从而减少特征信息丢失,增强对文本区域特征提取力度,并采用多边形偏移文本域与文本边缘信息相结合的方式准确定位文本区域。为了评估本文方法的有效性,在现有经典数据集ICDAR2015和CTW1500上进行了多组对比实验,实验结果表明在复杂场景下该方法文本检测的性能更加卓越。
-
-
林金朝;
文盼;
庞宇
-
-
摘要:
针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图。同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练。仿真结果表明,该算法模型在不同数据集上具有良好的检测性能。
-
-
曲超然;
陈立伟;
王建生;
王水根
-
-
摘要:
仪表读数的检测与识别被广泛应用在工业中,然而工程领域中复杂的背景环境为获取仪表信息带来了困难。为了解决光照不均、背景复杂、图像模糊、仪表倾斜以及遮挡等多种干扰问题,本文设计了一种基于深度学习的数字仪表读数算法。首先使用图像增广方法丰富数字仪表检测数据集,并利用数据合成的方法构建了数字仪表文本识别数据集;然后通过可微分二值化处理(DB)分割算法进行文符区域检测简化后处理过程,同时提出了一种适用于数字仪表图像的预处理方法,通过引入注意力机制改进卷积循环神经网络(CRNN)算法,对检测后的数据进行文符识别。在上述测试集中检测率可达到88.3%,识别准确率可达到96%。通过实验发现,该算法不仅可以提高整体识别准确率至90%以上,同时降低了复杂度,提高了识别效率。
-
-
黄子涵;
黄豪;
林丹盈;
曹洋瑞;
张泽填;
肖振球
-
-
摘要:
自然场景图像中的文字识别,不同于传统文本字符识别。自然场景图像中的文字经常面临着视角变化,多字体文本以及场景图像曝光严重等多种因素的影响,因此,难以准确地获取自然场景图像中字符信息。该文利用可微分二值化函数对自然场景图像进行处理,得到一张易处理二值化图像,并对二值化图像进行文本检测以便机器处理识别,最后利用卷积递归神经网络(CRNN);进行文本识别。该方法不仅提高了自然场景图像字符识别的准确度,而且解决了生活中多字体文字识别的难点。
-
-
王漳;
梁祖红;
罗孝波
-
-
摘要:
CTPN文本检测模型在细粒度文本检测过程中会出现断连、漏检的情况,尤其是在细粒度的文本场景下。针对以上问题,提出了一种细粒度文本检测算法。该算法基于CTPN模型网络进行改进,重新设计了垂直锚点尺度,以适应细粒度文本的特征;同时调整主干网络的结构适应锚点的尺度。在anchor的连接过程中采用了自适应间隔的连接方式,从而保留水平语义信息的完整性。文本识别阶段采用CRNN方式进行识别。通过PyTorch环境验证细粒度的发票数据集,所提方法相比于原CTPN文本定位方法效果显著提高。
-
-
贾颖;
程艳云
-
-
摘要:
随着深度学习的发展,自然场景的文本检测取得了进步,但多方向和弯曲中文文本检测效果仍不理想.针对多方向和弯曲中文文本的检测问题,提出一种融合注意力机制的多尺度文本检测方法.为了平衡模型准确性和降低计算复杂度,采用轻量级Resnet18为主干网络.针对特征金字塔(FPN)提取的特征分布不确定性的问题,嵌入平衡注意力机制(BAM)提取有效文本特征并抑制低效特征通道,进而提升检测方法的鲁棒性.针对空洞空间金字塔池化网络(ASPP)下采样时图像局部信息和细节信息丢失的问题,改进ASPP以降低特征图分辨率的损失.针对FPN提取特征不足以及感受野小的问题,将嵌入注意力机制的FPN和改进的ASPP并行增强特征提取融合.针对正负样本的不平衡性的问题,基于可微二值化模块在二值图损失中引入对数化的AC Loss,从而增强检测模型的泛化能力.在公开数据集MSRA-TD500上的实验结果表明,该算法与目前快速高效的DBnet相比,准确率、召回率和F值分别提升0.1%、1.4%和0.6%,并且该算法的检测速率也有较好表现.
-
-
刘艳菊;
伊鑫海;
李炎阁;
张惠玉;
刘彦忠
-
-
摘要:
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率。
-
-
胡高丽;
文成玉
-
-
摘要:
针对自然场景下交通标志牌文本粘连、字体复杂、大小形状不一、难以分行,导致交通文本标识率低的问题,提出一种基于PSENet+CRNN的改进交通文本检测识别算法。检测算法以PSENet为基础网络,采用特征增强模块FEM来增加模型的接受域,并改进空洞卷积的特征金字塔模型来增强多支路深层语义信息的融合能力。文本识别部分在CRNN模型中采用CTC+CenterLoss实现功能和标签的对齐、解决预测重复、预测漏字时的对齐问题。最终在CTST-1600数据集上进行验证,检测准确率达到了92.5%,字符识别率达到了88.9%,与原算法相比,分别提升了识别率4.3%和2.3%。实验结果表明,该方法有效提升了模型的检测与识别精度。
-
-
彭栋;
支世尧;
李盛达;
杨鹏
-
-
摘要:
基于深度学习的检测方法在文本形状较规则的情况下,已经取得较好的检测结果,但对于倾斜以及弯曲的文本行仍有改进空间。文章在渐进式尺度扩展网络PSENet的基础上,通过使用Res2Net模块提取多尺度特征,并结合全局卷积网络GCN进行特征融合,来对原有模型进行改进。根据在SCUT-CTW1500和Total-Text数据集的实验结果对比,证明改进的算法有效可行。
-
-
-
阮宏玮;
李华;
王小雨;
吴承勇;
庞滨
- 《中国教育和科研计算机网CERNET第十八届学术年会》
| 2011年
-
摘要:
本文首先分析了校园网络的建设意义,介绍了校园网络监控服务的现状,比较了主流的网页防篡改技术。在此基础上提出了网页比对属性的概念,给出选取比对属性的原则,并提出了以比对属性为核心的文本检测方法。最后设计并实现了基于快照轮询及文本检测的批量网站网页防篡改系统,阐述主要技术要点细节,给出总体设计框架,分析了系统优缺点,并指明了下一步的工作方向。
-
-
欧文武;
朱军民;
刘昌平
- 《中国自动化与信息技术研讨会暨2004年学术年会》
| 2004年
-
摘要:
由于二维Gabor滤波器在最小化时域和频域协调的不确定性上达到最优,同时在方向和频率上的可选择性,多通道Gabor滤波器在纹理识别、分类、目标检测等领域得到广泛的运用[13,16].本文将Gabor变换引入视频文本检测,介绍了一种基于Gabor变换的文本检测方法,比较系统的介绍了Gabor滤波器、Gabor参数的选取、Gabor特征向量的选择、特征空间维数的确定和利用Gabor特征向量分类的问题.
-
-
张佑生;
彭青松;
汪荣贵;
偶春生
- 《2003全国数字媒体与数字城市学术会议》
| 2003年
-
摘要:
提出了一种基于子图像的变异灰度直方图(VCH)的检测与定位文本的方法,对子图像VCH的映射特征及其与图像文本的对应关系作了分析,并给出文本检测与定位的有效算法.该算法通过对行分割子图像VCH中的凸台和列分割子图像VCH中的凹谷的识别与定位,实现在图像中快速检测与定位文本.文章给出了计算试验的结果,并进行了分析与评价.
-
-
WANG Qiang;
王强;
QI Min;
齐敏
- 《第十四届全国信号和智能信息处理与应用学术会议》
| 2021年
-
摘要:
针对模糊低品质光学字符识别准确率低的问题,在研究已有光学字符识别算法的基础上,改进优化相关算法,调整识别结构,设计完成一套模糊低品质字符串识别系统.在图像增强方面,提出一种以Canny算子为卷积核,结合Laplace锐化操作,对模糊字符进行图像增强的算法;在文本检测方面,实现了基于MSER算法的文本检测;在模糊字符识别方面,设计了一种两层结构分类器,缩短了识别时间,提高了识别准确率.
-
-
Yang Bin;
杨彬;
Xia Siyu;
夏思宇
- 《第十一届中国智能机器人会议》
| 2015年
-
摘要:
针对自然场景下多方向、多语种文本区域提出了一种新的检测方法.该方法首先使用提出的边界提升最大稳定极值区域(MSER)算法,检测得到相比传统MSER算法更少的文本候选区域;然后依据设计的含有多个分类器的字符分拣树对候选区域进行层层分拣,剔除绝大部分菲字符区域;接着使用提出的多层融合的聚合算法逐层对候选字符进行融合生成文本行;最后采用随机森林分类器对文本行进行验证.通过在ICDAR2003和MSRA-TD500数据集上的测试与比较,结果证明该方法在综合性能上要优于目前常用方法.
-