首页> 中文学位 >藏文音节字手写识别
【6h】

藏文音节字手写识别

代理获取

目录

声明

插图索引

表格索引

缩略语对照表

第一章 绪论

1.1课题研究背景与意义

1.2藏文识别研究现状与发展

1.3常见的手写文字识别方法

1.4主要内容及章节安排

第二章 藏文特征及实验数据库介绍

2.1藏文文字特征

2.2手写藏文识别难点

2.3实验数据库介绍

2.4本章小节

第三章 基于特征提取及多分类器级联的手写藏文音节识别

3.1引言

3.2手写藏文音节字的预处理

3.3手写藏文音节字的特征提取

3.4手写藏文音节字的分类器设计

3.5实验

3.6全手写藏文输入法软件开发

3.7本章小结

第四章 基于卷积神经网络的手写藏文音节字识别

4.1引言

4.2卷积神经网络

4.3手写藏文音节字识别

4.4实验

4.5本章小节

第五章 总结与展望

5.1工作总结

5.2工作展望

参考文献

致谢

作者简介

展开▼

摘要

在科技日新月异、信息化飞速发展的今天,手写藏文识别的研究还处于起步阶段,藏族同胞手机中的输入法软件还停留在全键盘模式,浩如烟海的藏文文献典籍数字化工作仍亟待进行。小至藏族同胞的生活需求,大到少数民族文化的传承,都离不开手写藏文识别技术的发展。因此,研究手写藏文识别技术对少数民族非物质文化遗产的保护具有重大意义,是我国文字识别工作者义不容辞的责任。
  本文介绍了藏文识别的研究现状,分析了藏文的特征与识别难点。由于在实际应用中,藏文以音节字作为书写单元,因此,本文首次对手写体藏文音节字识别技术,进行了较为系统的理论和实验研究。本文将基于特征提取的文字识别方法和基于深度学习的文字识别方法,应用于藏文音节字识别研究中,并取得了以下主要研究成果:
  1.在藏族同胞的协助下,本文根据藏文音节的字母组合动态比率数据,统计出579种常用的藏文音节字,并采集了60套手写藏文音节字样本,建立了包含34740个藏文手写音节字样本的数据库。
  2.本文将特征提取文字识别方法应用于手写藏文音节字识别中。在预处理步骤中,为了保留藏文音节字的结构信息,本文提出了基线上下线性归一化方法,并将该方法与非线性归一化、平滑处理、插值和重采样进行结合,最大程度地保留了手写藏文音节字的原始信息,滤除了冗余信息,便于特征的提取与分类识别。在特征抽取步骤中,本文根据手写体藏文音节字自身的书写特点,提出了将上元音特征和八方向线素特征相结合的特征识别方法,并应用于藏文手写音节字的识别研究。在分类器设计步骤中,为解决藏文音节字由于元音符号区别较小而造成相似字多、识别率低的难题,以及考虑到移动平台这个比较特殊的开发环境,本文提出了将上元音特征作为粗分类器,与欧式距离和MQDF分类器进行级联的三级分类器设计方案。
  3.本文通过实验对比了欧氏距离和三级分类器级联的识别效果。采用三级分类器级联时,前三平均识别率为94.18%,前五平均识别率达到了96.45%。实验结果表明,本文算法识别效果较好。本文对基于特征提取的算法进行性能测试后,将算法移植至移动终端,采用谷歌推出的输入法框架Android Input Method Framework进行手写输入法软件开发,完成了基于安卓系统的全手写藏文输入法软件。
  4.本文将基于深度学习的文字识别方法应用于藏文手写音节字的识别研究中。本文在经典手写数字识别网络LeNet-5模型的网络结构上进行改进,通过调节网络结构和参数,使网络性能达到最优,实验结果表明,最高识别率达到了91.2%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号