基于Transformer增强架构的中文语法纠错方法

王辰成; 杨麟儿; 王莹莹; 杜永萍; 杨尔弘

首页> 中文期刊>中文信息学报 >基于Transformer增强架构的中文语法纠错方法

基于Transformer增强架构的中文语法纠错方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语法纠错任务是自然语言处理领域的一项重要任务,近年来受到了学术界广泛关注.该任务旨在自动识别并纠正文本中所包含的语法、拼写以及语序错误等.该文将语法纠错任务看作是翻译任务,即将带有错误表达的文本翻译成正确的文本,采用基于多头注意力机制的Transformer模型作为纠错模型,并提出了一种动态残差结构,动态结合不同神经模块的输出来增强模型捕获语义信息的能力.受限于目前训练语料不足的情况,该文提出了一种数据增强方法,通过对单语语料的腐化从而生成更多的纠错数据,进一步提高模型的性能.实验结果表明,该文所提出的基于动态残差的模型增强以及腐化语料的数据增强方法对纠错性能有着较大的提升,在NLPCC 2018中文语法纠错共享评测数据上达到了最优性能.

著录项

来源
《中文信息学报》|2020年第6期|106-114|共9页
作者
王辰成; 杨麟儿; 王莹莹; 杜永萍; 杨尔弘;
展开▼
作者单位

北京工业大学信息学部北京 100124;

北京语言大学语言资源高精尖创新中心北京 100083;

北京语言大学语言资源高精尖创新中心北京 100083;

北京语言大学信息科学学院北京 100083;

北京语言大学语言资源高精尖创新中心北京 100083;

北京语言大学信息科学学院北京 100083;

北京工业大学信息学部北京 100124;

北京语言大学语言资源高精尖创新中心北京 100083;

北京语言大学信息科学学院北京 100083;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语法纠错; 多头注意力; 动态残差结构; 数据增强;

相似文献

中文文献
外文文献
专利

1. 基于Transformer局部信息及语法增强架构的中文拼写纠错方法 [J] . 段建勇 ,袁阳 ,王昊 . 北京大学学报：自然科学版 . 2021,第1期
2. 基于Transformer的中文纠错系统设计与实现 [J] . 李丹丹 . 数字技术与应用 . 2021,第012期
3. 基于Transformer的中文纠错系统设计与实现 [J] . 李丹丹 . 数字技术与应用 . 2021,第012期
4. 中文语法纠错方法的研究综述 [J] . 赵国红 . 现代计算机（专业版） . 2021,第028期
5. 关于中文拼写纠错数据增强的方法 [J] . 李建义 ,白雪丽 ,王洪俊 . 北华航天工业学院学报 . 2021,第006期
6. 基于Transformer增强架构的中文语法纠错方法 [C] . WANG Chencheng ,王辰成 ,YANG Liner . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于搜索引擎的中文纠错方法研究与实现 [A] . 杨苏稳 . 2019

基于Transformer增强架构的中文语法纠错方法

摘要

著录项

相似文献

相关主题

期刊订阅