文摘
英文文摘
声明
第一章绪论
1.1统计语言模型简介
1.2机器翻译简介
1.3本文的工作
第二章统计语言模型
2.1理论基础
2.1.1概率论基础
2.1.2最大似然估计
2.1.3 n元语言模型(N-gram模型)
2.1.4其他语言模型
2.1.5语言模型的评价标准
2.2经典平滑算法
2.2.1加法平滑技术
2.2.2 Good-Turing平滑算法
2.2.3 katz平滑算法
2.2.4线性插值平滑
2.2.5 Witten-Bell平滑算法
2.2.6 Kneser-Ney平滑算法
2.3海量语言模型
2.3.1分块-合并算法
2.3.2分布式语言模型
2.3.2更简单的平滑算法
2.4小结
第三章海量语言模型的训练
3.1 Google Web 1T语料库
3.2总体设计
3.2.1设计原则
3.2.2语言模型的训练流程
3.3词典的生成和快速存取算法
3.4 n-gram计数
3.5语言模型的生成
3.5.1语言模型的数据结构
3.5.2数据结构中字段大小的设置
3.5.3从n-gram计数文件创建语言模型
3.6小结
第四章海量语言模型的调用
4.1动态链接库
4.2语言模型服务器
4.3分布式语言模型
4.3.1子语言模型的切割
4.3.2分布式语言模型的架构
第五章在机器翻译系统中的实验结果
5.1实验结果
5.2机器翻译结果示例
第六章总结展望
参考文献
致谢