声明
摘要
1 绪论
1.1 课题研究的背景及意义
1.2 文本分类研究面临的主要问题
1.3 本文研究的主要内容及论文安排
2 文本分类相关技术概述及研究现状
2.1 数据预处理
2.2 文本表示
2.2.1 文本特征单元构造
2.2.2 表示模型
2.2.3 文本表示研究现状
2.3 特征降维
2.3.1 特征选择技术
2.3.2 特征提取技术
2.3.3 文本特征降维方法研究现状
2.4 分类模型
2.4.1 常见的文本分类方法
2.4.2 文本分类算法的研究现状
2.5 常用数据集
2.6 性能评价指标
2.7 本章小结
3 正则化线性统计模型概述
3.1 正则化技术简述
3.2 线性回归模型
3.2.1 简单的线性回归模型
3.2.2 Logistic回归模型
3.2.3 偏差-方差分解
3.3 带正则化约束的线性回归模型
3.3.1 岭回归
3.3.2 Lasso
3.3.3 结构正则化
3.4 本章小结
4 基于类别信息融合的非负矩阵分解的文本降维算法
4.1 引言
4.2 非负矩阵分解概述
4.2.1 非负矩阵分解的定义及求解
4.2.2 非负矩阵分解的不唯一性
4.3 基于类别融合的非负矩阵分解实现维数约减
4.3.1 类别信息融合
4.3.2 基正交化非负矩阵分解
4.3.3 维数约减方法
4.4 实验
4.4.1 数据集
4.4.2 性能评价指标
4.4.3 实验结果
4.5 本章小结
5 面向文本分类的非负稀疏语义编码算法
5.1 引言
5.2 非负稀疏语义编码
5.2.1 字典构造
5.2.2 非负稀疏表达
5.3 实验
5.3.1 数据集
5.3.2 性能评价指标
5.3.3 实验结果
5.4 本章小结
6 基于正则化极限学习机的文本分类算法
6.1 引言
6.2 极限学习机概述
6.3 基于正则化极限学习机的文本分类
6.3.1 文本表示
6.3.2 正则化极限学习机
6.3.3 分类算法
6.4 实验
6.4.1 数据集
6.4.2 性能评价指标
6.4.3 实验结果
6.5 本章小结
7 基于分组结构的正则化回归模型的文本分类算法
7.1 引言
7.2 模型构建
7.3 模型实现
7.3.1 组结构生成算法
7.3.2 模型求解
7.3.3 文本分类算法
7.4 实验
7.4.1 数据集
7.4.2 性能评价指标
7.4.3 实验结果
7.5 本章小结
8 总结与展望
参考文献
攻读博士学位期间主要研究成果
致谢