首页> 中文学位 >大词汇量脱机手写蒙古文整词识别研究
【6h】

大词汇量脱机手写蒙古文整词识别研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景及意义

1.2 手写识别方法分类及蒙古文特点分析

1.3 脱机手写蒙古文识别研究现状

1.4 本文的研究重点

1.5 本文的结构安排

第二章 相关模型介绍

2.1卷积神经网络

2.2 循环神经网络

2.3 连接时序分类器

2.4 注意力机制

第三章 CRNN-CTC模型的脱机手写蒙古文整词识别

3.1小词汇量脱机手写蒙古文数据集

3.2 CRNN-CTC模型

3.3 实验结果与分析

3.4 本章小结

第四章 序列到序列模型的脱机手写蒙古文整词识别

4.1 大词汇量脱机手写蒙古文数据集

4.2 具有注意力机制的序列到序列模型

4.3 不同的帧序列生成方式实验

4.4 数据增强实验

4.5 大词汇量脱机手写蒙古文数据集对比实验

4.6 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

展开▼

摘要

近年来,随着数字化技术的飞速发展,越来越多的蒙古文手写文献资源被转换成图像格式加以保存。然而,图像格式的蒙古文手写文献资源并不适合词频统计、内容分析、编辑与检索。因此,本文针对脱机手写蒙古文识别问题开展相关研究,为挖掘和利用蒙古文手写文献资源提供便利。 蒙古文独特的构词方式导致其词汇量巨大,据统计蒙古文词汇量可达数百万,常用词汇也有几十万。此外,本文所关注的脱机手写蒙古文是非受限书写,在这种条件下,单词书写变形非常严重,这使得脱机手写蒙古文识别任务极具挑战性。针对蒙古文词汇量巨大、书写变形严重等特点,本文提出了适合于蒙古文构词特点和书写方式的整词识别方法。本文的主要工作如下: (1)采用目前文字识别领域最为流行的卷积循环神经网络与连接时序分类器相结合的模型(Convolution Recurrent Neural Network-Connectionist Temporal Classification,CRNN-CTC),实现了脱机手写蒙古文整词识别。在相关脱机手写蒙古文数据集上进行测试,并与该数据集上性能最佳的深度神经网络与隐马尔科夫相结合的模型(Deep Neural Network-Hidden Markov Model,DNN-HMM)进行对比,实验结果表明CRNN-CTC模型比DNN-HMM模型更适合完成脱机手写蒙古文整词识别任务。 (2)针对蒙古文构词方式及书写特点,本文提出了具有注意力机制的序列到序列模型,并采用两种不同的帧序列生成方式。该模型将脱机手写识别任务看成手写单词图像帧序列到标签序列的映射问题,而且注意力机制能够解决因输入序列过长导致的信息丢失问题。在大词汇量脱机手写蒙古文数据集上进行测试,所提出模型的性能不但优于DNN-HMM模型,也优于CRNN-CTC模型。实验结果表明具有注意力机制的序列到序列模型不但能在一定程度上克服单词书写变形的影响,同时还能有效解决集外词问题,因此其更适合完成大词汇量脱机手写蒙古文整词识别任务。 (3)针对大词汇量脱机手写蒙古文数据集中样本不足的问题,本文采用空间变换方法实现了数据增强。使用该数据增强方法生成新样本,使得增强后数据集的样本数量扩充一倍。之后,在具有注意力机制的序列到序列模型上验证数据增强的效果,实验结果表明本文所提出的数据增强方法能进一步提升识别性能。

著录项

  • 作者

    刘聪;

  • 作者单位

    内蒙古大学;

  • 授予单位 内蒙古大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 魏宏喜;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 英语;
  • 关键词

    大词汇量; 脱机手写; 蒙古文整词;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号