用于在线手写公式合成的编解码网络

杨晨; 杜俊; 薛莫白; 张建树

首页> 中文期刊> 《中国图象图形学报》 >用于在线手写公式合成的编解码网络

用于在线手写公式合成的编解码网络

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目的在线公式识别是一种将在线输入手写轨迹点序列转换为公式文本的任务,其广泛应用在手机、平板等便携式设备上。众所周知,训练数据对于神经网络十分重要,但获取有标注的在线公式数据所需要的成本十分昂贵,在训练数据不足的情况下,深度神经网络在该任务上的泛化性和鲁棒性会受到影响。为此,提出了一个基于编码—解码模型的在线数据生成模型。方法该模型从给定的公式文本生成对应的在线轨迹点序列,从而灵活地扩充训练数据规模。生成模型在编码器端设计了结合树形表示的文本特征提取模块,并且引入了基于位置的注意力算法,使模型实现了输入文本序列与输出轨迹序列间的对齐。同时,解码器端融入了不同手写人风格特征,使模型可以生成多种手写人风格的样本。结果实验中,首先,将本文生成方法在不同类型输入文本和不同手写人风格上的结果可视化,并展示了模型在多数情况下的有效性。其次,生成模型合成的额外数据可作为训练集的增广,该数据被用于训练Transformer-TAP(track,attend,and parse)、TAP和DenseTAP-TD(DenseNet TAP with tree decoder)模型,并分析了3种模型在使用增广数据前后的性能变化。结果表明,引入增广数据分进行训练后,3个模型的绝对识别率分别提升了0.98%、1.55%和1.06%;相对识别率分别提升了9.9%、12.37%和9.81%。结论本文提出的在线生成模型可以更加灵活地实现对原有数据集的增广,并有效提升了在线识别模型的泛化性能。

著录项

来源
《中国图象图形学报》 |2023年第8期|2356-2369|共14页
作者
杨晨; 杜俊; 薛莫白; 张建树;
展开▼
作者单位

中国科学技术大学语音及语言信息处理国家工程研究中心;

合肥230026;

科大讯飞股份有限公司;

合肥230088;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
深度学习; 手写公式识别; 端到端; 编解码模型; 数据增广;

相似文献

中文文献
外文文献
专利

1. 人在回路的在线手写数学公式识别方法 [J] . 康文惠 ,黄进 ,田丰 . 计算机辅助设计与图形学学报 . 2021,第11期
2. 在线手写数学公式结构分析算法 [J] . 洪留荣 . 计算机应用 . 2010,第9期
3. 基于多任务学习的注意力机制双向GRU用于在线手写签名认证 [J] . 沈奇 ,栾方军 ,袁帅 . 计算机科学与应用 . 2022,第2期
4. 用于在线中文手写签名认证系统中的GA个性化特征选择方法 [J] . 刘扬 ,施泽生 . 计算机应用与软件 . 2007,第8期
5. 基于端对端网络模型的手写公式识别 [J] . 管延智 ,孙浩 ,冯帅 . 计算机应用与软件 . 2022,第12期
6. 手写化学公式的在线切分识别 [C] . 姜映映 ,王绪刚 ,敖翔 . 第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议 . 2006
7. 在线手写体数学公式的分割与识别算法研究 [A] . 张虹扬 . 2016

用于在线手写公式合成的编解码网络

摘要

著录项

相似文献

相关主题

期刊订阅