Synthetic Dataset Generation for Text Recognition with Generative Adversarial Networks

机译：生成对抗网络的文本识别综合数据集生成

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Automated text recognition is used in autonomous driving systems, search engines, document analysis, and manyother applications. There are many techniques to extract text information from scanned documents, but text recognitionfrom arbitrary images is a much harder task. Recently suggested deep learning approaches have demonstrated highqualityresults, but they require a huge amount of data to achieve them. The process of collecting and labelling trainingdata to train a deep learning network is costly. In this paper, we suggest an approach for automatic dataset generation fortext recognition for arbitrary languages. We use a generative adversarial network structure, which is adapted to generatereadable and clear text looking naturally on the image background. We evaluate our approach using SegLink andTextboxes++ text localization models, which were trained on examples generated by SynthText and by variations of ourmethod. The comparison showed the superiority of our method on a subset of the ICDAR 2017 dataset for English andArabic languages.

机译：自动文本识别可用于自动驾驶系统，搜索引擎，文档分析以及许多其他领域。其他应用程序。有很多技术可以从扫描的文档中提取文本信息，但是文本识别从任意图像中提取图像是一项艰巨的任务。最近建议的深度学习方法已经证明了高质量结果，但它们需要大量数据才能实现。收集和标记培训的过程训练深度学习网络的数据非常昂贵。在本文中，我们提出了一种用于自动生成数据集的方法任意语言的文本识别。我们使用生成式对抗网络结构，该结构适于生成清晰可读的文本，自然而然地出现在图像背景上。我们使用SegLink和 Textboxes ++文本本地化模型，该模型针对SynthText生成的示例以及我们的变体进行了培训方法。比较结果显示了我们的方法在ICDAR 2017数据集的英语和英语的子集上的优势阿拉伯语。

著录项

来源
《Society of Photo-Optical Instrumentation Engineers;International Conference on Machine Vision;American Science and Engineering Institute》||1143315.1-1143315.7|共7页
会议地点
作者
Valeria Efimova; Viacheslav Shalamov; Andrey Filchenkov;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Generative Adversarial Network-Based Face Recognition Dataset Generation [J] . Sooyoung Cho, Daeyeol Kim, Sinwoo Yoo, International Journal of Applied Engineering Research . 2018,第22aPta3期

机译：基于生成的对抗网络的人脸识别数据集生成
2. Customizable text generation via conditional text generative adversarial network [J] . Chen Jinyin, Wu Yangyang, Jia Chengyu, Neurocomputing . 2020,第Nova27期

机译：可定制的文本通过条件文本生成对抗网络生成
3. A Realistic Image Generation of Face From Text Description Using the Fully Trained Generative Adversarial Networks [J] . Muhammad Zeeshan Khan, Saira Jabeen, Muhammad Usman Ghani Khan, Quality Control, Transactions . 2021,第1期

机译：使用完全训练的生成对冲网络从文本描述中逼真的脸部生成
4. Synthetic Dataset Generation for Text Recognition with Generative Adversarial Networks [C] . Valeria Efimova, Viacheslav Shalamov, Andrey Filchenkov International Conference on Machine Vision . 2020

机译：具有生成对冲网络的文本识别的合成数据集生成
5. Augmenting Electrocardiogram Datasets Using Generative Adversarial Networks [D] . Alladi, Santhosh. 2020

机译：使用生成的对抗网络增强心电图数据集
6. SynSigGAN: Generative Adversarial Networks for Synthetic Biomedical Signal Generation [O] . Debapriya Hazra, Yung-Cheol Byun 2020

机译：Synsiggan：合成生物医学信号产生的生成对抗网络
7. Latent Code and Text-based Generative Adversarial Networks for Soft-text Generation [O] . Md. Akmal Haidar, Mehdi Rezagholizadeh, Alan Do Omri, 2019

机译：用于软文本生成的潜在代码和基于文本的生成对抗网络

Synthetic Dataset Generation for Text Recognition with Generative Adversarial Networks

摘要

著录项

相似文献

相关主题

期刊订阅