摘要
第1章 绪论
1.1 研究目的和意义
1.2 国内外相关研究
1.2.1 错别字校对研究现状
1.2.2 机器翻译研究现状
1.2.3 神经网络研究现状
1.3 本文主要研究内容
1.4 本文的组织安排
第2章 基于汉字-拼音-汉字转换的近音错别字语料库构造
2.1 引言
2.2 人工近音错别字语料库构造系统框架
2.3 基于模糊拼音的错字候选集构造
2.3.1 音素资源库构造
2.3.2 拼音-汉字语料库构造
2.3.3 错字候选集构造
2.4 语言模型解码
2.4.1 N元语言模型
2.4.2 训练语言模型
2.4.3 错字候选解码
2.5 神经网络最大熵过滤
2.5.1 神经网络最大熵模型
2.5.2 正字-错字对过滤问题
2.5.3 神经网络最大熵特征选取
2.6 实验数据
2.6.1 模糊拼音策略
2.6.2 N元语言模型策略
2.6.3 神经网络最大熵过滤策略
2.7 本章小结
第3章 基于统计机器翻译的近音错别字校对
3.1 引言
3.2 基于统计机器翻译的近音错字校对系统框架
3.3 词对齐处理
3.4 错别字校对的语言模型
3.5 错别字校对的翻译模型
3.6 实验结果与分析
3.6.1 实验数据和评价指标
3.6.2 不同构造近音错别字语料库策略对近音错别字校对的影响
3.6.3 统计机器翻译模型本身对近音错别字校对的影响
3.6.4 实验对比
3.7 本章小结
第4章 基于神经网络的机器翻译近音错别字校对
4.1 引言
4.2 基于神经网络的机器翻译近音错别字校对系统框架
4.3 神经网络模型
4.3.1 循环神经网络模型
4.3.2 长短时记忆网络模型
4.4 基于神经网络的机器翻译模型校对近音错别字
4.4.1 基于神经网络机器翻译模型策略
4.4.2 统计机器翻译框架结合神经网络语言模型的策略
4.5 实验结果与分析
4.5.1 实验数据和评价指标
4.5.2 神经网络机器翻译模型的近音错别字校对参数优化
4.5.3 统计机器翻译框架结合神经网络语言模型的参数优化
4.5.4 不同校对方法的对比实验
4.6 本章小结
结论
参考文献
致谢
攻读硕士学位期间发表的学术论文及参加的科研项目
声明