摘要
Abstract
第1章 绪论
1.1 课题背景及研究意义
1.1.1 课题背景
1.1.2 研究的意义
1.2 国内外研究现状
1.3 本文的主要内容
第2章 统计语言模型及平滑技术
2.1 统计语言模型
2.1.1 N-gram语言模型
2.1.2 语言模型的性能评价标准
2.2 统计语言模型的数据平滑技术
2.2.1 Good-Turing估计
2.2.2 Jelinek-Mercer平滑
2.2.3 Katz平滑
2.2.4 Church-Gale平滑
2.2.5 Average-count平滑
2.2.6 基于二项式后验分布的回退方法
2.3 本章小结
第3章 潜在语义与统计相结合的语言模型
3.1 概述
3.2 潜在语义分析原理
3.2.1 特征表示
3.2.2 奇异值分解
3.2.3 伪文档的表示
3.3 聚类
3.3.1 词聚类
3.3.2 文档聚类
3.4 潜在语义分析语言模型的建立
3.4.1 直接建模
3.4.2 词聚类建模
3.4.3 文档聚类建模
3.4.4 联合聚类建模
3.5 潜在语义分析模型和统计模型的结合
3.6 本章小结
第4章 实验方法和结果分析
4.1 语料准备工作
4.1.1 语料来源
4.1.2 语料预处理
4.2 统计语言模型的建立
4.3 潜在语义分析语言模型的建立
4.4 两种形式语言模型的结合
4.5 实验结果及分析
4.6 本章小结
结论
参考文献
致谢
哈尔滨工业大学;