声明
摘要
第1章 绪论
1.1 研究背景
1.2 研究现状
1.3 研究内容
1.4 研究方案
1.5 论文章节安排
第2章 基于互信息的网络百科词条相关度计算
2.1 词条相关度计算方法概述
2.2 相关工作
2.2.1 通过语义知识库的词条相关度计算方法
2.2.2 基于大规模语料库的统计信息计算词条相关度的方法
2.2.3 基于网络百科的词条相关度计算方法
2.3 算法介绍
2.3.1 百度百科网页结构
2.3.2 算法流程
2.3.3 互信息(MI)算法的理论基础
2.3.4 互信息算法的实现
2.4 实验结果
2.4.1 实验数据
2.4.2 实验结果
2.5 本章小结
第3章 特征选取与降维
3.1 相关工作
3.2 文本预处理
3.2.1 分词处理
3.2.2 去除停用词
3.3 如何选取特征
3.3.1 bag-of-words特征
3.3.2 N-gram特征
3.3.3 词性特征
3.3.4 词意特征
3.3.5 特征选择算法
3.4 语义扩展和语义泛化
3.4.1 语义扩展
3.4.2 语义泛化
3.5 本章小结
第4章 基于DBN的特征学习
4.1 研究背景
4.2 相关工作
4.3 深度置信网络
4.3 限制玻尔兹曼机RBM
4.4 对比散度(Contrastive Divergence)
4.5 softmax函数回归
4.6 本章小结
第5章 手机语音助手实网数据问题分类
5.1 手机助手语音数据分类的特点
5.2 分类的整体框架
5.3 实验设置
5.3.1 实验数据
5.3.2 评价指标
5.3.3 基本特征的选取
5.3.4 训练数据的选取
5.3.5 语义泛化
5.3.6 分类算法
5.3.7 语义扩展
5.3.8 深度学习
5.4 本章小结
第6章 原型系统的构建
6.1 整体框架
6.2 词条相关度计算模块
6.3 文本预处理
6.4 特征选择
6.5 语义扩展
6.6 语义泛化
6.7 分类算法
6.8 深度学习
结论
致谢
参考文献
攻读硕士学位期间发表的论文及科研成果