基于多语言模型融合的鲁棒手写后处理方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着智能终端的飞速发展，在移动端市场上，开发一种具备篇章级连续手写能力的输入法是很有必要的。本文提出了一种全新的手写输入模式，并基于这种模式设计并开发了iOS手写输入法，该输入法能够自动对手写文字进行切分、识别，并通过统计语言模型来提升系统整体的性能。
　　由于汉字具有结构复杂，字体多变，而且不同书写者手写体差异大的特点，仅仅依靠识别器的单字识别，已经很难再进一步提升识别准确率，所以在单字识别的基础上，利用统计语言模型，结合文本上下文信息来对识别结果序列进行后处理是一种有效的方法，但是传统的语言模型均是在N-gram模型的基础上演化得来，即便加入了一些外部特征来降低模型的困惑度，却仍然无法摆脱N-gram模型带来的根源性影响，本文将针对这一问题，提出两种解决途径，一种是修改语言模型来降低错误传递对整体识别结果的影响，另一种是结合循环神经网络来增强模型的路径选择能力。对于第一种途径，本文主要借鉴了神经网络中的双向启发和Skip-gram模型中的跳跃思想，共提出了6种增强系统鲁棒性的方法，并将提升效果最好的跳跃统计模型与循环神经网络进行结合来查找最优路径。
　　实验中，本文以人民日报语料，Wiki百科中文语料以及Sogou在线新闻语料作为训练数据集，在中科院采集的CASIA-OLHWDB2.0，2.1和2.2（总计约135万字的在线连续手写数据集）的部分数据集上进行测试。结果表明，本文提出的跳跃语言模型在增强语言模型的鲁棒性以及消除错误传递的问题上首选率提升了3.35％，并且在修改F值上有很大幅度的提升，从数据上证明了方法在解决错误传递问题的有效性。

著录项

作者
黄哲敏;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名陈清财;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.14;
关键词
手写输入法; 文字处理; 统计语言模型; 整体识别; 循环神经网络;
入库时间 2022-08-17 10:36:58

相似文献

中文文献
外文文献
专利

1. 基于门控循环单元神经网络和Huber-M估计鲁棒卡尔曼滤波融合方法的锂离子电池荷电状态估算方法 [J] . 李超然 ,肖飞 ,樊亚翔 . 电工技术学报 . 2020,第009期
2. 一种基于非线性鲁棒H∞方法的半直驱风电机组有功功率控制方法 [J] . 孙景涛 ,李海平 ,谢家安 . 广东电力 . 2019,第003期
3. 基于鲁棒近似方法的高超声速导弹复合控制方法研究 [J] . 姚勤 ,杜英 ,王宇轩 . 上海航天 . 2015,第004期
4. 基于低秩矩阵近似的鲁棒DOA估计方法 [J] . 温超 ,徐丽云 ,段鹏婷 . 北京理工大学学报 . 2022,第2期
5. 基于并行学习鲁棒自适应的行驶车辆特性参数估计方法研究 [J] . 汪月英 ,梁峰 . 计算机应用与软件 . 2022,第2期
6. 基于鲁棒一步集的Tube不变集鲁棒模型预测控制 [C] . 秦伟伟 ,刘刚 ,王剑 . 2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆 . 2011
7. 基于LMI方法的一类不确定系统的鲁棒正实性分析及鲁棒正实控制 [A] . 李静 . 2008

基于多语言模型融合的鲁棒手写后处理方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅