声明
摘要
第一章 绪论
1.1 本文研究背景及意义
1.2 国内外研究现状
1.2.1 国外的研究现状
1.2.2 国内的研究现状
1.3 本文的组织结构
第二章 短文本分类的相关技术
2.1 短文本分类流程
2.2 预处理
2.3 特征表示
2.4 特征选择
2.4.1 互信息(MI)
2.4.2 期望交叉熵(ECE)
2.4.3 卡方检验(CHI)
2.4.4 信息增益(IG)
2.4.5 文本频数(DF)
2.5 特征权重计算
2.6 分类算法
2.6.1 KNN分类算法
2.6.2 朴素贝叶斯分类算法
2.7 本章小结
第三章 基于自监督的半监督学习短文本预处理
3.1 半监督学习的模型假设
3.2 基于图的半监督学习
3.2.1 图结构的定义
3.2.2 建立图结构
3.3 本文提出的基于自监督的半监督学习
3.3.1 自监督
3.3.2 改进的预处理算法步骤
3.4 实验与分析
3.4.1 实验数据
3.4.2 实验过程
3.4.3 评价指标
3.4.4 实验结果与分析
3.5 本章小结
第四章 基于半监督学习和搜索引擎的短文本特征扩展方法
4.1 基于关联规则的短文本特征扩展方法
4.1.1 关联规则集的获取
4.1.2 基于自选择机制的短文本特征扩展
4.2 改进的短文本特征扩展方法
4.2.1 短文本关键字提取
4.2.2 短文本的相似度计算
4.2.3 算法描述
4.3 实验与分析
4.3.1 实验数据
4.3.2 实验流程
4.3.3 实验结果与讨论
第五章 基于SVM和半监督学习的短文本分类算法
5.1 本文提出的基于SLAS的短文本分类算法
5.1.1 问题描述
5.1.2 支持向量机
5.1.3 本文使用的核函数
5.1.4 本文提出的基于SLAS的短文本分类算法步骤
5.2 本文在短文本分类步骤中的使用的方法
5.2.1 基于向量空间模型的特征表示
5.2.2 基于主成分分析法的特征选择算法
5.2.3 基于TF-IDF的特征权重计算
5.3 优化的基于SLAS-C的短文本分类算法
5.3.1 分类回归树算法(CART)
5.3.2 优化的SLAS-C算法
5.4 实验与分析
5.4.1 实验数据
5.4.2 实验流程
5.4.3 实验结果与分析
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
作者简介