文摘
英文文摘
独创性声明和学位论文版权使用授权书
第一章引言
1.1概述
1.2统计学理论
1.2.1基本概念
1.2.2最大似然估计
1.2.3贝叶斯概率模型
1.2.4随机过程与马尔可夫过程
1.3信息论基础
1.3.1信息熵
1.3.2噪声-信道模型
1.3.3互信息
1.3.4平均互信息
1.4统计机器学习
1.4.1概述
1.4.2 Bootstrapping算法
1.4.3 EM算法
第二章统计语言模型
2.1概述
2.2主要技术及应用
2.2.1 n-gram模型
2.2.2决策树模型
2.2.3指数模型
2.3统计平滑
2.3.1平滑算法分类
2.3.2 Additive平滑算法
2.3.3 Good-Turing平滑算法
2.3.4 Jelinek-Mercer平滑算法
2.3.5 Absolute Discounting平滑算法
2.3.6 Katz平滑算法
2.4参数估计
2.5模型裁减
2.6模型评价
2.7依存语言模型发展及应用
第三章信息检索模型
3.1概述
3.2传统的信息检索模型
3.2.1布尔检索模型
3.2.2模糊集模型
3.2.3双泊松模型
3.2.4向量空间模型
3.2.5概率统计模型
3.3统计语言模型在信息检索中的应用
3.4模型评价
3.4.1精度与召回率
3.4.2统计意义的评价
第四章依存语言模型在信息检索中的应用
4.1依存语言模型
4.1.1依存语法与链语法
4.1.2依存关系的定义
4.1.3依存关系的抽取
4.2模型训练及建立
4.2.1 Unigram模型
4.2.2 Bi-gram模型
4.2.3 Bi-terms模型
4.2.4依存语言模型
4.3参数估计
4.3.1P(L|MD)的计算
4.3.2 P(w|MD)的计算
4.3.3 MI(wi,wj|L,MD)的计算
第五章实验结果及评价
5.1实验设置
5.2实验流程
5.3实验结果及分析
5.3.1 BM vs.依存语言模型
5.3.2 Unigram模型vs.依存语言模型
5.3.3 Bi-gram模型vs.依存语言模型
5.3.4 Bi-gram模型vs.Bi-terms模型
5.3.5结论及分析
5.3.6参数取值范围的分析
第六章总结与展望
参考文献
致谢
论文发表及科研经历