文摘
英文文摘
第一章绪论
1.1问题提出
1.2本论文的研究内容
1.3本论文的结构安排
第二章涉及的知识基础
2.1文本分类概述
2.1.1分类方法概述
2.1.2文本表示与向量空间模型
2.1.3分类性能评价函数
2.2向量空间模型
2.2.1关于VSM的基本概念
2.2.2项的选择
2.2.3项的权重计算
2.2.4关于VSM的讨论
2.3支持向量机(SVM)分类方法
2.3.1支持向量机的原理
2.3.2 SVM分类器的评估与优化
2.3.3 SVM分类方法的应用
2.4 libsvm分类系统
2.5 Naive Bayes分类方法
第三章特征选择方法研究
3.1特征选择算法概述
3.2常用特征选择算法及评价
3.3一种新的基于类别的特征选择算法
3.4小结
第四章分类系统的设计与实现
4.1系统总体设计
4.1.1系统目标
4.1.2系统功能模块结构
4.2系统各主要模块设计与实现
4.2.1文本处理模块
4.2.2特征项提取模块
4.2.3构造分类器模块
4.2.4文本分类模块
4.2.5分类性能测试模块
第五章实验与分析
5.1实验数据
5.2实验结果及分析
5.2.1根据词的分辨力提取特征
5.2.2不同条件下的分类结果及性能分析
5.2.3分类效率分析
第六章结论与展望
6.1本文工作总结
6.2未来工作展望
致谢
参考文献
攻读硕士学位期间发表的论文