声明
摘要
第一章 绪论
1.1 引言
1.1.1 研究背景和意义
1.1.2 英文输入纠错研究现状
1.1.3 中文输入纠错研究现状
1.2 本文的主要内容
1.3 章节安排
第二章 问答系统及其技术介绍
2.1 问答系统的原理介绍
2.2 问答系统的关键技术
2.2.1 中文分词
2.2.2 词性标注
2.2.3 关键词提取与扩展
2.2.4 相似度计算
2.3 本章小结
第三章 统计语言模型的分析与建立
3.1 n元语法
3.2 模型的建立
3.2.1 数据准备
3.2.2 语言模型的存储方式
3.2.3 语言模型压缩处理
3.3 数据平滑
3.3.1 问题的提出
3.3.2 平滑方法
3.3.3 平滑算法的选择
3.4 本章小结
第四章 基于N-gram统计语言模型的中文纠错技术
4.1 系统设计思想
4.2 本文研究在系统中的关键技术
4.2.1 二元接续关系查错
4.2.2 汉字转拼音纠错算法
4.2.3 映射表map的引入
4.2.4 语言模型解码算法
4.3 系统框架与流程
4.4 系统测试与结果分析
4.4.1 测试环境和测试语料
4.4.2 系统纠错实验结果
4.5 本章小结
第五章 总结与展望
参考文献
致谢
学位论文评阅及答辩情况表