摘要
第一章绪论
第一节研究背景与研究意义
一、研究背景
二、研究意义
第二节研究现状
一、英文文本自动校对现状
二、中文文本自动校对现状
三、研究难点及现状总结
第三节研究内容及研究框架
一、研究内容
二、研究框架
第四节创新点
第二章相关理论阐述
第一节词法分析
一、分词
二、词性标注
第二节N-gram语言模型
第三节序列标注
一、词向量化
二、长短时记忆循环神经网络
三、条件随机场
第三章数据准备和预处理
第一节中文真词错误分类
一、中文错别字分类
二、中文真词错误分类
第二节数据集介绍
一、实验数据集
二、混淆集
三、训练集和测试集
四、外部数据
第四章中文真词错误自动校对算法
一、基于局部特征的N-gram模型
二、CS-N-gram算法自动校对
第二节基于混淆集和序列标注的自动校对算法
一、BiLSTM-CRF模型
二、CS-BiLSTM-CRF算法自动校对
第三节实验结果分析
一、实验评估指标
二、实验结果
三、算法优缺点分析
第四节实验改进——自动校对混合算法
一、混合算法自动校对
二、相关实验分析
第五节本章小结
第五章总结与展望
第一节总结
第二节展望
参考文献
致谢
声明
浙江工商大学;