文摘
英文文摘
学位论文独创性声明及学位论文使用授权声明
第一章绪论
1.1文本自动分类研究的背景和意义
1.2文本自动分类的定义
1.3文本自动分类研究现状
1.4中文文本自动分类技术简介
1.5文本自动分类的性能评价
1.6本文的主要工作
第二章文本的表示
2.1向量空间模型的基本概念
2.2特征项的选择
2.3项的权重计算
2.4关于VSM的讨论
第三章文本特征提取
3.1特征项获取
3.1.1汉语自动分词
3.1.2 n元模型
3.2特征选择方法
3.2.1特征选择方法
3.2.2关于特征选择的讨论
第四章基于支持向量机的分类算法研究
4.1统计学习理论
4.1.1经验风险最小化原理
4.1.2 VC维和推广性的界
4.1.3结构风险最小化原理
4.2支持向量机
4.3 SVM应用于文本分类的改进
4.4增量式SVM文本分类算法
4.4.1 Karush-Kuhn-Tucker条件
4.4.2 SV的特点分析
4.4.3增量学习算法
第五章Bayes文本分类算法研究
5.1Naive Bayes文本分类算法
5.2 Naive Bayes文本分类算法的改进
5.3增量式Bayes文本分类算法
5.3.1 Bayes增量学习模型
5.3.2增量式Bayes文本分类
5.3.3相关讨论
第六章中文文本自动分类原型系统的实现及实验分析
6.1系统的体系结构
6.2系统的实现
6.3实验结果与性能分析
6.3.1特征选择方法测试
6.3.2增量式Bayes分类器训练实验
第七章结束语
参考文献
附录一读研期间参与项目情况
附录二读研期间发表论文情况
附录三读研期间获奖情况
致谢