基于LSTM和N-gram的ESL文章的语法错误自动纠正方法

谭咏梅; 杨一枭; 杨林; 刘姝雯

首页> 中文期刊> 《中文信息学报》 >基于LSTM和N-gram的ESL文章的语法错误自动纠正方法

基于LSTM和N-gram的ESL文章的语法错误自动纠正方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

To deal with the incorrect usage of articles and prepositions in GEC (Grammatical Error Correction) area , this paper proposes a sequence labeling method .As for incorrect usage of noun form ,verb form and subject-verb a-greement ,this paper proposes an N-gram voting strategy based on corpus collected from ESL (English as Second Language) essays and news .The results show that the method in this paper on CoNLL (2013) corpus achieves an overall F1 score of 33 .87%,outperforming the top ranked UIUC's F1 score (31 .20%) ,and a 38 .05% F1 score for article errors and 28 .89% for preposition errors ,both exceeding UIUC's result (33 .40% for article errors and 7.22% for preposition errors ,respectively).%针对英语文章语法错误自动纠正(Grammatical Error Correction ,GEC)问题中的冠词和介词错误,该文提出一种基于LSTM (Long Short-Term Memory ,长短时记忆)的序列标注GEC方法;针对名词单复数错误、动词形式错误和主谓不一致错误,因其混淆集为开放集合,该文提出一种基于ESL (English as Second Lauguage)和新闻语料的N-gram投票策略的GEC方法.该文方法在2013年CoNLL的GEC数据上实验的整体F1值为33.87%,超过第一名UIUC的F1值31 .20%.其中,冠词错误纠正的 F1值为38 .05%,超过 UIUC冠词错误纠正的 F1值33.40%,介词错误的纠正F1为28.89%,超过UIUC的介词错误纠正F1值7 .22%.

著录项

来源
《中文信息学报》 |2018年第6期|19-27|共9页
作者
谭咏梅; 杨一枭; 杨林; 刘姝雯;
展开▼
作者单位

北京邮电大学计算机学院,北京100876;

北京邮电大学计算机学院,北京100876;

北京邮电大学计算机学院,北京100876;

北京邮电大学计算机学院,北京100876;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语法错误自动纠正; LSTM; N-gram投票策略; ESL语料;

相似文献

中文文献
外文文献
专利

1. 基于神经机器翻译的英语语法错误纠正方法分析 [J] . 王蕊 . 自动化技术与应用 . 2021,第008期
2. 基于数据增广和复制的中文语法错误纠正方法 [J] . 汪权彬 ,谭营 . 智能系统学报 . 2020,第001期
3. 基于N-Gram的计算机病毒特征码自动提取的改进方法 [J] . 杨燕 ,蒋国平 . 计算机科学 . 2017,第0z2期
4. 一种基于N-Gram的计算机病毒特征码自动提取方法 [J] . 曾键 ,赵辉 . 计算机安全 . 2013,第010期
5. OpenE:一种基于n-gram共现的自动机器翻译评测方法 [J] . 孙连恒 ,杨莹 ,姚天顺 . 中文信息学报 . 2004,第002期
6. 基于N-gram的无参考译文机器翻译自动评测方法 [C] . 徐金安 ,蒋俊杰 . 第七届全国机器翻译研讨会 . 2011
7. 基于神经机器翻译方法的英语语法错误纠正研究 [A] . 邓俊锋 . 2019

基于LSTM和N-gram的ESL文章的语法错误自动纠正方法

摘要

著录项

相似文献

相关主题

期刊订阅