Grayscale-Projection Based Optimal Character Segmentation for Camera-Captured Faint Text Recognition

机译：基于灰度投影的相机捕获模糊文本识别的最佳字符分割

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

The faint text document images possess shallow characters inherently and the camera-captured form introduces more degradations such as low-resolution, non-uniform illumination and out-of-focus blur, which make the text binarization very difficult. In this paper, we propose a grayscale-projection based optimal character segmentation method for camera-captured faint text recognition. Instead of extracting the character candidates, we use the gradient projection to extract a series of segmentation candidates which contain inter-character gaps and intra-character gaps as well. In order to select the optimal segmentation path from all possible situations, we construct a segmentation tree and set a evaluation score for each path. The score integrates the information of single point projection, overall distribution and recognition probability. Finally the optimal segmentation path is obtained by selecting the path with the highest score. We collect a faint text recognition dataset and evaluate our method on it. Experimental results show that our method outperforms the binary-projection method and the convolutional recurrent neural network approach in terms of text segmentation and recognition accuracy.

机译：淡淡的文本文档图像固有地具有较浅的字符，而相机捕获的格式引入了更多的降级，例如低分辨率，照明不均匀和离焦模糊，这使得文本二值化非常困难。在本文中，我们提出了一种基于灰度投影的最优字符分割方法，用于相机捕获的模糊文本识别。代替提取候选字符，我们使用梯度投影提取一系列包含候选字符间隙和字符内间隙的分割候选字符。为了从所有可能的情况中选择最佳分割路径，我们构造了一个分割树并为每个路径设置了一个评估分数。分数综合了单点投影，总体分布和识别概率的信息。最后，通过选择得分最高的路径来获得最佳分割路径。我们收集了一个模糊的文本识别数据集，并在此数据集上评估了我们的方法。实验结果表明，我们的方法在文本分割和识别准确性方面优于二元投影方法和卷积递归神经网络方法。

著录项

来源
《IAPR International Conference on Document Analysis and Recognition》|2017年|1301-1306|共6页
会议地点
作者
Fuxi Jia; Cunzhao Shi; Yanna Wang; Chunheng Wang; Baihua Xiao;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Image segmentation; Text recognition; Vegetation; Image recognition; Character recognition; Training; Testing;

机译：图像分割;文本识别;植被;图像识别;字符识别;训练;测试;

相似文献

外文文献
中文文献
专利

1. Segmentation of connected characters in text-based CAPTCHAs for intelligent character recognition [J] . Hussain Rafaqat, Gao Hui, Shaikh Riaz Ahmed Multimedia Tools and Applications . 2017,第24期

机译：在基于文本的验证码中对连接字符进行分段以实现智能字符识别
2. Text recognition in multimedia documents: a study of two neural-based OCRs using and avoiding character segmentation [J] . Khaoula Elagouni, Christophe Garcia, Franck Mamalet, International Journal on Document Analysis and Recognition . 2014,第1期

机译：多媒体文档中的文本识别：使用和避免字符分割的两个基于神经的OCR研究
3. Text-Line and Character Segmentation for Off-line Recognition of Handwritten Japanese Text [J] . Kha Cong Nguyen, Nakagawa Masaki 電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2015,第517期

机译：文本行和字符分割，用于手写日语文本的离线识别
4. Grayscale-Projection Based Optimal Character Segmentation for Camera-Captured Faint Text Recognition [C] . Fuxi Jia, Cunzhao Shi, Yanna Wang, IAPR International Conference on Document Analysis and Recognition . 2017

机译：基于灰度投影的摄像机捕获微弱文本识别的最佳字符分段
5. A segmentation-free approach to text recognition with application to Arabic text. [D] . Al-Badr, Badr H. 1995

机译：一种无分段的文本识别方法，适用于阿拉伯文本。
6. Urdu Nasta’liq text recognition using implicit segmentation based on multi-dimensional long short term memory neural networks [O] . Saeeda Naz, Arif Iqbal Umar, Riaz Ahmed, -1

机译：基于多维长短期记忆神经网络的隐式分割的Urdu Nastaliq文本识别
7. A New Gradient based Character Segmentation Method for Video Text Recognition [O] . 2015

机译：一种新的基于梯度的视频文本识别字符分割方法

Grayscale-Projection Based Optimal Character Segmentation for Camera-Captured Faint Text Recognition

摘要

著录项

相似文献

相关主题

期刊订阅