您现在的位置: 首页> 研究主题> 文本检测

文本检测

文本检测的相关文献在2000年到2023年内共计787篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、数学 等领域,其中期刊论文176篇、会议论文7篇、专利文献1124421篇;相关期刊109种,包括中国图象图形学报、电脑知识与技术、计算机工程与设计等; 相关会议7种,包括第九届中国多智能体系统与控制会议(MASC2013)、中国教育和科研计算机网CERNET第十八届学术年会、中国自动化与信息技术研讨会暨2004年学术年会等;文本检测的相关文献由1677位作者贡献,包括秦勇、李兵、姚锟等。

文本检测—发文量

期刊论文>

论文:176 占比:0.02%

会议论文>

论文:7 占比:0.00%

专利文献>

论文:1124421 占比:99.98%

总计:1124604篇

文本检测—发文趋势图

文本检测

-研究学者

  • 秦勇
  • 李兵
  • 姚锟
  • 章成全
  • 张子浩
  • 李宏亮
  • 白翔
  • 邹北骥
  • 余英林
  • 刘军
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 高刘雅; 孙冬; 高清维; 卢一相; 黄志祥; 吴丹
    • 摘要: 为解决目前驾驶证打印中复杂纹理以及原始文字背景条件的限制,提出一种基于改进连接文本提议网络(CTPN)的文本信息完整性检测方法。通过引入帧间差分的方法,先对图像作背景擦除;然后对帧差后的图像进行CTPN文本信息检测,同时引入非极大值抑制(NMS)算法提高检测框的精度。对比未经过背景擦除的图像文本检测结果,实验表明:该方法在驾驶证文本检测中具有更好的文本信息检测效果。
    • 李云洪; 闫君宏; 胡蕾
    • 摘要: 自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全局特征融合,对恒等残差块进行改进实现局部细粒度特征融合,从而减少特征信息丢失,增强对文本区域特征提取力度,并采用多边形偏移文本域与文本边缘信息相结合的方式准确定位文本区域。为了评估本文方法的有效性,在现有经典数据集ICDAR2015和CTW1500上进行了多组对比实验,实验结果表明在复杂场景下该方法文本检测的性能更加卓越。
    • 林金朝; 文盼; 庞宇
    • 摘要: 针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图。同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练。仿真结果表明,该算法模型在不同数据集上具有良好的检测性能。
    • 曲超然; 陈立伟; 王建生; 王水根
    • 摘要: 仪表读数的检测与识别被广泛应用在工业中,然而工程领域中复杂的背景环境为获取仪表信息带来了困难。为了解决光照不均、背景复杂、图像模糊、仪表倾斜以及遮挡等多种干扰问题,本文设计了一种基于深度学习的数字仪表读数算法。首先使用图像增广方法丰富数字仪表检测数据集,并利用数据合成的方法构建了数字仪表文本识别数据集;然后通过可微分二值化处理(DB)分割算法进行文符区域检测简化后处理过程,同时提出了一种适用于数字仪表图像的预处理方法,通过引入注意力机制改进卷积循环神经网络(CRNN)算法,对检测后的数据进行文符识别。在上述测试集中检测率可达到88.3%,识别准确率可达到96%。通过实验发现,该算法不仅可以提高整体识别准确率至90%以上,同时降低了复杂度,提高了识别效率。
    • 黄子涵; 黄豪; 林丹盈; 曹洋瑞; 张泽填; 肖振球
    • 摘要: 自然场景图像中的文字识别,不同于传统文本字符识别。自然场景图像中的文字经常面临着视角变化,多字体文本以及场景图像曝光严重等多种因素的影响,因此,难以准确地获取自然场景图像中字符信息。该文利用可微分二值化函数对自然场景图像进行处理,得到一张易处理二值化图像,并对二值化图像进行文本检测以便机器处理识别,最后利用卷积递归神经网络(CRNN);进行文本识别。该方法不仅提高了自然场景图像字符识别的准确度,而且解决了生活中多字体文字识别的难点。
    • 王漳; 梁祖红; 罗孝波
    • 摘要: CTPN文本检测模型在细粒度文本检测过程中会出现断连、漏检的情况,尤其是在细粒度的文本场景下。针对以上问题,提出了一种细粒度文本检测算法。该算法基于CTPN模型网络进行改进,重新设计了垂直锚点尺度,以适应细粒度文本的特征;同时调整主干网络的结构适应锚点的尺度。在anchor的连接过程中采用了自适应间隔的连接方式,从而保留水平语义信息的完整性。文本识别阶段采用CRNN方式进行识别。通过PyTorch环境验证细粒度的发票数据集,所提方法相比于原CTPN文本定位方法效果显著提高。
    • 贾颖; 程艳云
    • 摘要: 随着深度学习的发展,自然场景的文本检测取得了进步,但多方向和弯曲中文文本检测效果仍不理想.针对多方向和弯曲中文文本的检测问题,提出一种融合注意力机制的多尺度文本检测方法.为了平衡模型准确性和降低计算复杂度,采用轻量级Resnet18为主干网络.针对特征金字塔(FPN)提取的特征分布不确定性的问题,嵌入平衡注意力机制(BAM)提取有效文本特征并抑制低效特征通道,进而提升检测方法的鲁棒性.针对空洞空间金字塔池化网络(ASPP)下采样时图像局部信息和细节信息丢失的问题,改进ASPP以降低特征图分辨率的损失.针对FPN提取特征不足以及感受野小的问题,将嵌入注意力机制的FPN和改进的ASPP并行增强特征提取融合.针对正负样本的不平衡性的问题,基于可微二值化模块在二值图损失中引入对数化的AC Loss,从而增强检测模型的泛化能力.在公开数据集MSRA-TD500上的实验结果表明,该算法与目前快速高效的DBnet相比,准确率、召回率和F值分别提升0.1%、1.4%和0.6%,并且该算法的检测速率也有较好表现.
    • 刘艳菊; 伊鑫海; 李炎阁; 张惠玉; 刘彦忠
    • 摘要: 随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率。
    • 胡高丽; 文成玉
    • 摘要: 针对自然场景下交通标志牌文本粘连、字体复杂、大小形状不一、难以分行,导致交通文本标识率低的问题,提出一种基于PSENet+CRNN的改进交通文本检测识别算法。检测算法以PSENet为基础网络,采用特征增强模块FEM来增加模型的接受域,并改进空洞卷积的特征金字塔模型来增强多支路深层语义信息的融合能力。文本识别部分在CRNN模型中采用CTC+CenterLoss实现功能和标签的对齐、解决预测重复、预测漏字时的对齐问题。最终在CTST-1600数据集上进行验证,检测准确率达到了92.5%,字符识别率达到了88.9%,与原算法相比,分别提升了识别率4.3%和2.3%。实验结果表明,该方法有效提升了模型的检测与识别精度。
    • 彭栋; 支世尧; 李盛达; 杨鹏
    • 摘要: 基于深度学习的检测方法在文本形状较规则的情况下,已经取得较好的检测结果,但对于倾斜以及弯曲的文本行仍有改进空间。文章在渐进式尺度扩展网络PSENet的基础上,通过使用Res2Net模块提取多尺度特征,并结合全局卷积网络GCN进行特征融合,来对原有模型进行改进。根据在SCUT-CTW1500和Total-Text数据集的实验结果对比,证明改进的算法有效可行。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号