基于深度学习的印刷蒙古文字体分类与单词图像超分辨率研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着数字化技术的飞速发展，大量印刷蒙古文文献资源（图书、期刊、杂志等）可以通过采用当下广泛流行的技术——光学字符识别（Optical Character Recognition，OCR），将其转换为相应的电子文档，但在转换过程中会遇到以下两方面问题。第一，现有的印刷蒙古文OCR系统采用基于字元切分的方法对蒙古文单词进行识别，但某些字体下的蒙古文单词很难被准确切分成字元，导致单词无法识别。此外，蒙古文独特的构词方式导致其词汇量巨大（词汇量达数百万），并且文档中多种字体混排的现象普遍存在，这使得训练一个能够识别多种蒙古文字体、大词汇量的整词识别系统的时间代价过高。因此，如果能够确定待识别单词所属字体，可事先为每种字体单独构建各自的整词识别系统，从而有效解决上述问题。第二，某些情况下采集得到的印刷蒙古文文档图像分辨率过低，这将导致文档中各单词图像无法被蒙古文OCR系统有效识别。因此，有必要针对低分辨率图像进行重建，以生成能够被有效识别的高分辨率图像。针对第一个问题，本文以印刷蒙古文单词图像为对象，将字体分类看成是一种特殊的图像分类任务，提出了基于卷积神经网络（Convolutional Neural Network，CNN）的蒙古文字体分类方法，即：蒙古文单词图像作为卷积神经网络的输入，相应蒙古文字体类别作为类标号。根据蒙古文构词方式及其书写特点，本文设计了一种浅层CNN网络结构，在相关数据集上与三种经典CNN网络（包括：LeNet-5、AlexNet和GoogLeNet）进行对比。实验结果表明本文所设计的CNN网络结构的性能优于LeNet-5和AlexNet，并能够达到与GoogLeNet相同的性能，但其网络结构更浅、参数更少，因此本文所设计的CNN网络结构能够有效解决印刷蒙古文字体分类问题。针对第二个问题，本文以低分辨率印刷蒙古文单词图像为对象，采用深度递归卷积网络（Deeply-RecursiveConvolutional Network，DRCN）模型对低分辨率单词图像进行重建，得到相应的高分辨率单词图像。在相关数据集上，本文采用的DRCN模型与传统插值算法（临近点插值法、双线性插值法和双三次插值法）进行对比。实验结果表明DRCN模型能够有效重构出高分辨率的蒙古文单词图像，从而解决单词图像的超分辨率问题。

著录项

作者
温雅;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科计算机科学与技术
授予学位硕士
导师姓名魏宏喜;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字学;
关键词
深度学习; 印刷; 蒙古文; 字体分类; 单词;
入库时间 2022-08-17 10:59:47

相似文献

中文文献
外文文献
专利

1. 基于深度学习的高分辨率遥感图像识别与分类研究 [J] . 张日升 ,张燕琴 . 信息通信 . 2017,第001期
2. 基于深度学习的高分辨率遥感影像分类研究 [J] . 卢涵宇 ,胡超 ,张涛 . 广西大学学报（自然科学版） . 2020,第002期
3. 基于深度学习的超分辨率图像重建研究综述 [J] . 郑璐 ,王保云 ,杨昆 . 计算机与数字工程 . 2021,第004期
4. 基于深度学习的图像超分辨率研究 [J] . 陈锦伦 ,王勇 ,王瑛 . 电脑知识与技术 . 2021,第030期
5. 基于深度学习的单图像超分辨率重建研究综述 [J] . 南方哲 ,钱育蓉 ,行艳妮 . 计算机应用研究 . 2020,第002期
6. 多字体印刷蒙古文识别后处理研究 [C] . 包艳花 ,图格木勒 . 中国中文信息学会二十五周年学术会议 . 2006
7. 基于深度学习的高分辨率卫星图像分类研究 [A] . 李继旭 . 2020

基于深度学习的印刷蒙古文字体分类与单词图像超分辨率研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅