摘要
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 样本空间研究现状
1.2.2 特征选择算法研究现状
1.2.3 文本分类算法研究现状
1.3 研究目标与内容
1.3.1 研究目标
1.3.2 主要研究内容
1.4 论文的组织结构
2 文本分类流程及相关分类模型
2.1 文本分类总体流程
2.2 文本预处理
2.3 文本表示
2.4 文本分类算法
2.4.1 朴素贝叶斯模型
2.4.2 伯努利朴素贝叶斯模型
2.4.3 多项式朴素贝叶斯模型
2.4.4 补集朴素贝叶斯模型
2.4.5 朴素贝叶斯文本分类流程
2.5 文本分类器评价方法和标准
2.5.1 文本分类器评价方法
2.5.2 文本分类器评价标准
2.6 本章小结
3 基于近邻文本加权补集的朴素贝叶斯分类算法研究
3.1 文本距离度量方法
3.2 文本权重的标准化方法
3.3 KWCNB文本分类改进算法
3.3.1 算法的核心思想
3.3.2 算法的基本原理
3.3.3 算法的基本流程
3.4 仿真实验与分析
3.4.1 数据选取
3.4.2 数据预处理
3.4.3 实验结果与分析
3.5 本章小结
4 基于属性加权补集的朴素贝叶斯分类算法研究
4.1 特征选择方法
4.2 特征加权方法
4.3 TFWCNB文本分类改进算法
4.3.1 算法的核心思想
4.3.2 算法的基本原理
4.3.3 算法的基本流程
4.4 仿真实验与分析
4.4.1 数据选取及预处理
4.4.2 实验结果与分析
4.5 本章小结
5 基于文本加权补集的朴素贝叶斯组合提升算法研究
5.1 组合分类算法
5.1.1 装袋组合算法
5.1.2 随机森林组合算法
5.1.3 AdaBoost提升算法
5.2 ADAWCNB组合提升改进算法
5.2.1 算法的核心思想
5.2.2 算法的基本原理
5.2.3 算法的基本流程
5.3 实验与结果
5.3.1 数据选取及预处理
5.3.2 实验结果与分析
5.4 本章小结
结论
参考文献
攻读学位期间发表的学术论文
致谢
声明