基于最大熵模型的冠词错误纠正系统

陈朝才; 吴敏; 吴桂兴; 郭燕

首页> 中文期刊> 《计算机系统应用》 >基于最大熵模型的冠词错误纠正系统

基于最大熵模型的冠词错误纠正系统

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

研究了英语语法中冠词错误的计算机自动纠正. 首先对冠词使用的错误进行定义分类, 并考虑到可能出现冠词缺失的情况, 通过采用基于最大熵模型的分类器, 选择包含上下文、上下文词性、短语结构等特征, 在训练集上进行模型预的训练, 然后使用模型对于输入句子进行预测并纠正存在的使用错误. 在NUCLE语料的实验中, 给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响, 并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果, 还根据英语语法中存在的错误特点对模型进行改进, 最后在测试数据达到35.48%的F值,相较于CoNLL2013的shared task中最好结果有小幅提升.%Computer automation correction of article errors in English grammar is been studied. First we define the categories of article errors, and missing articles is also included, by using a maximum entropy model, extracting features covering context, part of speech, noun phrase structure and so on, training the model on the training corpus, then use the model to predict and correct the article errors of an input sentence. In the experiment on NUCLE corpus, effects of corpus preprocess, model types and the size of the training corpus are discussed. We make a comparison with the popular Naive Bayes model, at last we introduce the characters of English grammar to improve the model, a F-score of 35.48% is achieved, the result is slightly better than the best result in CoNLL 2013 shared task.

著录项

来源
《计算机系统应用》 |2015年第8期|85-90|共6页
作者
陈朝才; 吴敏; 吴桂兴; 郭燕;
展开▼
作者单位

中国科学技术大学现代教育技术中心;

合肥 230026;

中国科学技术大学现代教育技术中心;

合肥 230026;

中国科学技术大学苏州研究院;

苏州 235123;

中国科学技术大学苏州研究院;

苏州 235123;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
冠词错误; 计算机自动纠正; 最大熵模型;

相似文献

中文文献
外文文献
专利

1. 零冠词与零用冠词系统探索——兼及冠词系统(核心部分)重构 [J] . 张德禄 ,孙治国 . 山东外语教学 . 2014,第003期
2. 基于最大熵模型和地理信息系统地构叶生态适宜性研究 [J] . 吕蓉 ,韦翡翡 ,崔治家 . 中国中医药信息杂志 . 2020,第002期
3. 基于最大熵模型和地理信息系统的竹节参生态适宜性研究 [J] . 成希 ,吕蓉 ,韦翡翡 . 中国中医药信息杂志 . 2020,第009期
4. 基于最大熵模型的介词纠错系统 [J] . 李悦 ,吴敏 ,吴桂兴 . 计算机系统应用 . 2016,第001期
5. 基于最大熵模型的藏文不良文本识别系统的设计和实现 [J] . 仁青诺布 ,苏亚超 ,孙亚东 . 西藏科技 . 2014,第003期
6. 基于最大熵模型的中文阅读理解问答系统技术研究 [C] . 王凯华 ,李济洪 ,张国华 . 第九届全国计算语言学学术会议 . 2007
7. 基于最大熵模型(MaxEnt)和地理信息系统(ArcGis)预测藓类植物的地理分布范围——以广西花坪自然保护区为列 [A] . 麻亚鸿 . 2013

基于最大熵模型的冠词错误纠正系统

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅