第一章 绪论
1.1 研究工作的背景与意义
1.2.1 文本分类国外发展现状
1.2.2 文本分类国内发展现状
1.3 本论文的结构安排
第二章 文本分类基础
2.1文本分类综述
2.1.2 文本分类的定义
2.1.2 文本分类的处理环节
2.2 文本数据预处理
2.2.1 文本标记的处理
2.2.2 文本分词的处理
2.2.3 去除停用词
2.3 文本表示
2.4 特征降维
2.4.1 常见的特征选取算法
2.4.2 常见的权值计算算法
2.5 常见文本分类算法
2.5.1 朴素贝叶斯算法
2.5.2 K近邻算法
2.5.3 决策树算法
2.5.4 支持向量机
2.5.5 卷积神经网络
2.6 本章小结
第三章 改进的特征选取方法
3.1 特征选取方法概述
3.2 CHI、MI的改进策略
3.2.1 卡方统计算法的改进
3.2.2 互信息算法的改进
3.2.3 改进的卡方-互信息统计算法
3.3 TF-IDF权值算法的改进策略
3.4 极端梯度提升算法的改进策略
3.5 实验与结果分析
3.5.1 实验评价标准
3.5.2 传统机器学习算法实验
3.5.3 改进的特征选取方法实验
3.6 本章小结
第四章改进的支持向量机分类算法
4.1 支持向量机概述
4.2 核函数
4.2.1 全局核函数
4.2.2 局部核函数
4.3 核函数的改进
4.3.1 常用核函数
4.3.2 混合核函数的提出
4.4 实验与结果分析
4.4.1 混合核函数分类能力验证
4.4.2 混合核函数泛化能力验证
4.5 本章小结
第五章全文总结
5.1 论文工作总结
5.2存在的问题与展望
致谢
参考文献
攻读硕士学位期间取得的成果
电子科技大学;