文摘
英文文摘
声明
第一章绪论
1.1研究背景和意义
1.2国内外研究状况
1.3当前研究重点
1.4本文研究内容
1.5本论文的结构安排
1.6本章小结
第二章文本分类技术
2.1文本分类概述
2.2文本分类的特点
2.3文档表示
2.3.1文档集
2.3.2文档特征
2.3.3文档表示
2.4向量空间模型
2.4.1关于VSM的基本概念
2.4.2项的选择
2.4.3项的权重计算
2.4.4改进的权重计算
2.4.5向量空间模型应用
2.5文本分类方法
2.5.1分类方法概述
2.5.2简单向量距离分类法
2.5.3朴素贝叶斯
2.5.4决策树
2.5.5神经网络
2.5.6 K近邻
2.5.7支持向量机
2.6本章小结
第三章特征提取技术
3.1文档分词处理
3.2特征选择方法概述
3.3常用特征选择算法及评价
3.3.1文档频率
3.3.2信息增益
3.3.3期望交叉熵
3.3.4互信息
3.3.5x2统计
3.3.6证据权值
3.4基于类别信息特征选择方法
3.5本章小结
第四章中文文本自动分类系统
4.1中文文本自动分类模型
4.1.1分类模型的任务
4.1.2文本分类工作流程
4.2系统开发平台和系统模型
4.3系统的具体设计
4.3.1系统的用例图
4.3.2系统中的主要的类
4.3.3几个类之间的关系图
4.3.4顺序图
4.3.5系统中关键算法
4.3.6分类性能评估
4.4本章小结
第五章实验与分析
5.1实验环境
5.2比较特征选择方法的目的
5.3实验及性能分析
5.3.1特征选择方法在KNN中的比较
5.3.2特征选择方法在SVM中的比较
5.3.3数据不平衡时KNN的实验结果
5.3.4数据不平衡时SVM的实验结果
5.4本章小结
结论与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢