文摘
英文文摘
声明
1绪论
1.1研究背景和意义
1.2研究历史
1.3文本分类概述
1.3.1文本分类问题描述
1.3.2文本分类算法研究概述
1.4研究现状与热点
1.4.1经典分类算法的改进
1.4.2层次化文本分类
1.4.3多分类器组合
1.4.4多标签文本分类
1.5本文研究内容
2文本分类相关技术
2.1文本表示
2.1.1文本特征表示
2.1.2文本表示模型
2.2文本特征降维
2.2.1文档频率
2.2.2互信息
2.2.3信息熵
2.2.4信息增益
2.2.5 x2统计
2.3文本分类数据集
2.4分类器性能评估指标
3文本分类中词共现关系的研究
3.1词共现关系概述
3.2关联分析
3.2.1关联规则基本概念
3.2.2经典关联规则挖掘算法
3.2.3遗传算法在频繁集挖掘中的应用
3.2.4文本分类规则
3.3相关分析
3.3.1相关关系及其度量
3.3.2线性相关分析
3.3.3基于概率的相关性度量
3.3.4词相关关系分析
3.4本章小结
4关联分析在文本分类中的应用
4.1关联文本分类模型
4.1.1关联文本分类基本概念
4.1.2文本分类规则挖掘
4.1.3基于分类规则的文档类别判定
4.2关联文本特征选择
4.3实验及结果分析
4.3.1实验设计及描述
4.3.2实验结果及分析
4.4本章小结
5词相关性分析在文本分类中的应用
5.1基于线性相关分析的文本分类
5.1.1 LLSF文本分类
5.1.2基于LLSF的改进贝叶斯文本分类
5.2基于词间概率相关性分析的改进贝叶斯分类
5.2.1 TAN分类器的词间相关性分析
5.2.2基于词集相关度计算的改进贝叶斯分类
5.3实验及结果分析
5.3.1实验设计及描述
5.3.2实验结果及分析
5.4本章小结
6总结与展望
6.1本文总结
6.2进一步的工作
致谢
参考文献
附录 攻读博士学位期间发表的论文和出版著作情况