声明
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 本文的研究内容
1.4 本文组织结构
第2章 文本分类技术概述
2.1 文本预处理
2.1.1 预处理
2.1.2 中文分词
2.2 文本的表示
2.2.1 向量空间模型
2.2.2 布尔逻辑模型
2.2.3 概率模型
2.3 特征选择
2.3.1 文档频度
2.3.2 信息增益
2.3.3 互信息
2.3.4 CHI统计
2.4 权重计算
2.5 文本分类算法
2.5.1 质心向量分类算法
2.5.2 贝叶斯分类算法
2.5.3 k-近邻分类算法
2.5.4 支持向量机
2.6 分类性能评估
2.7 本章小结
第3章 粗糙集理论
3.1粗糙集理论简述
3.1.1 信息表知识表达系统
3.1.2 粗糙集的基本概念
3.2 粗糙集模型的特征
3.3 属性约简
3.3.1 属性约简与核
3.3.2 属性约简算法
3.4 本章小结
第4章 改进的粗糙集理论及其属性约简
4.1 基于差异关系的粗糙集
4.1.1 不完备的信息系统
4.1.2 差异关系
4.1.3 改进的差异关系
4.1.4 限制差异关系
4.2 改进差异关系的变精度粗糙集
4.3 改进差异关系粗糙集的属性约简
4.4 数值实验
4.4.1 信息表的数值实验
4.4.2 Irsi数据集上的数值实验
4.5 本章小结
第5章 基于X值的粗糙集文本分类方法
5.1 分类方法的基本原理
5.1.1 文本分类近似规则
5.1.2 CHI特征选择的改进
5.2 基于X值和改进粗糙集的规则抽取算法
5.2.1 规则提取主要步骤
5.2.2 分类规则抽取算法
5.3 数值实验过程与结果分析
5.4 本章小结
第6章 总结与展望
6.1 全文总结
6.2 后续研究工作展望
致谢
参考文献
攻读硕士学位期间论文发表情况
武汉理工大学;