首页> 中文学位 >基于深度学习的印刷蒙古文字体分类与单词图像超分辨率研究
【6h】

基于深度学习的印刷蒙古文字体分类与单词图像超分辨率研究

代理获取

目录

声明

第一章 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 论文结构安排

第二章 相关模型介绍

2.1 本文采用的深度学习模型

2.2 深度学习的优点

2.3 深度学习在相关领域的应用

第三章 基于卷积神经网络的印刷蒙古文字体分类

3.1 经典卷积神经网络模型

3.2 本文所设计卷积神经网络模型的结构

3.3 实验环境

3.4 实验与分析

3.5 本章小结

第四章 基于深度递归卷积网络的单词图像超分辨率研究

4.1 基于深度学习的超分辨率技术

4.2 实验与分析

4.3 本章小结

第五章 总结与展望

5.1 研究工作总结

5.2 展望

参考文献

致谢

攻读硕士学位期间学术成果

展开▼

摘要

近年来,随着数字化技术的飞速发展,大量印刷蒙古文文献资源(图书、期刊、杂志等)可以通过采用当下广泛流行的技术——光学字符识别(Optical Character Recognition,OCR),将其转换为相应的电子文档,但在转换过程中会遇到以下两方面问题。 第一,现有的印刷蒙古文OCR系统采用基于字元切分的方法对蒙古文单词进行识别,但某些字体下的蒙古文单词很难被准确切分成字元,导致单词无法识别。此外,蒙古文独特的构词方式导致其词汇量巨大(词汇量达数百万),并且文档中多种字体混排的现象普遍存在,这使得训练一个能够识别多种蒙古文字体、大词汇量的整词识别系统的时间代价过高。因此,如果能够确定待识别单词所属字体,可事先为每种字体单独构建各自的整词识别系统,从而有效解决上述问题。 第二,某些情况下采集得到的印刷蒙古文文档图像分辨率过低,这将导致文档中各单词图像无法被蒙古文OCR系统有效识别。因此,有必要针对低分辨率图像进行重建,以生成能够被有效识别的高分辨率图像。 针对第一个问题,本文以印刷蒙古文单词图像为对象,将字体分类看成是一种特殊的图像分类任务,提出了基于卷积神经网络(Convolutional Neural Network,CNN)的蒙古文字体分类方法,即:蒙古文单词图像作为卷积神经网络的输入,相应蒙古文字体类别作为类标号。根据蒙古文构词方式及其书写特点,本文设计了一种浅层CNN网络结构,在相关数据集上与三种经典CNN网络(包括:LeNet-5、AlexNet和GoogLeNet)进行对比。实验结果表明本文所设计的CNN网络结构的性能优于LeNet-5和AlexNet,并能够达到与GoogLeNet相同的性能,但其网络结构更浅、参数更少,因此本文所设计的CNN网络结构能够有效解决印刷蒙古文字体分类问题。 针对第二个问题,本文以低分辨率印刷蒙古文单词图像为对象,采用深度递归卷积网络(Deeply-RecursiveConvolutional Network,DRCN)模型对低分辨率单词图像进行重建,得到相应的高分辨率单词图像。在相关数据集上,本文采用的DRCN模型与传统插值算法(临近点插值法、双线性插值法和双三次插值法)进行对比。实验结果表明DRCN模型能够有效重构出高分辨率的蒙古文单词图像,从而解决单词图像的超分辨率问题。

著录项

  • 作者

    温雅;

  • 作者单位

    内蒙古大学;

  • 授予单位 内蒙古大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 魏宏喜;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 文字学;
  • 关键词

    深度学习; 印刷; 蒙古文; 字体分类; 单词;

  • 入库时间 2022-08-17 10:59:47

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号