首页> 中文学位 >基于多语言模型融合的鲁棒手写后处理方法
【6h】

基于多语言模型融合的鲁棒手写后处理方法

代理获取

目录

第1章 绪 论

1.1 课题来源

1.2 课题研究的目的及意义

1.3 国内外相关技术发展现状

1.4 本文的主要研究内容

1.5 章节的组织结构

第2章 连续手写输入法的相关技术

2.1 引言

2.2 联机手写单字符识别

2.3 连续手写汉字后处理

2.4 本章小结

第3章 连续手写汉字后处理鲁棒性方法

3.1 引言

3.2 传统手写后处理方法和问题

3.3 相关算法的选择与优化

3.4 鲁棒双向启发语言模型手写后处理

3.5 鲁棒跳跃语言模型手写后处理

3.6 深度神经网络手写后处理

3.7 本章小结

第4章 iOS平台下连续手写输入法实现

4.1 iOS平台简介

4.2 手写输入法的特点和功能

4.3 输入法系统的架构

4.4 核心算法的调用

4.5本章小结

第5章 系统评测对比实验

5.1 引言

5.2 实验数据

5.3 鲁棒语言模型性能评测

5.4 输入法性能评测

结论

参考文献

声明

致谢

展开▼

摘要

随着智能终端的飞速发展,在移动端市场上,开发一种具备篇章级连续手写能力的输入法是很有必要的。本文提出了一种全新的手写输入模式,并基于这种模式设计并开发了iOS手写输入法,该输入法能够自动对手写文字进行切分、识别,并通过统计语言模型来提升系统整体的性能。
  由于汉字具有结构复杂,字体多变,而且不同书写者手写体差异大的特点,仅仅依靠识别器的单字识别,已经很难再进一步提升识别准确率,所以在单字识别的基础上,利用统计语言模型,结合文本上下文信息来对识别结果序列进行后处理是一种有效的方法,但是传统的语言模型均是在N-gram模型的基础上演化得来,即便加入了一些外部特征来降低模型的困惑度,却仍然无法摆脱N-gram模型带来的根源性影响,本文将针对这一问题,提出两种解决途径,一种是修改语言模型来降低错误传递对整体识别结果的影响,另一种是结合循环神经网络来增强模型的路径选择能力。对于第一种途径,本文主要借鉴了神经网络中的双向启发和Skip-gram模型中的跳跃思想,共提出了6种增强系统鲁棒性的方法,并将提升效果最好的跳跃统计模型与循环神经网络进行结合来查找最优路径。
  实验中,本文以人民日报语料,Wiki百科中文语料以及Sogou在线新闻语料作为训练数据集,在中科院采集的CASIA-OLHWDB2.0,2.1和2.2(总计约135万字的在线连续手写数据集)的部分数据集上进行测试。结果表明,本文提出的跳跃语言模型在增强语言模型的鲁棒性以及消除错误传递的问题上首选率提升了3.35%,并且在修改F值上有很大幅度的提升,从数据上证明了方法在解决错误传递问题的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号