文摘
英文文摘
声明
1绪论
1.1引言
1.2文本分类问题
1.2.1文本分类的研究目的和意义
1.2.2文本分类的研究现状
1.2.3贝叶斯方法与文本分类
1.3本文的研究内容和组织结构
1.3.1本文的研究内容
1.3.2本文的组织结构
2基于向量空间模型的文本分类算法
2.1文本预处理和向量空间模型
2.1.1分词
2.1.2向量表示
2.1.3特征选择
2.2基于向量空间模型的文本分类方法
2.2.1简单距离向量判别法
2.2.2 Knn算法
2.2.3归纳逻辑方法
2.2.4支持向量机算法
2.2.5其他文本分类方法
2.3文本分类的评价方法
3贝叶斯理论与贝叶斯分类方法
3.1引言
3.2贝叶斯分类方法的原理
3.2.1贝叶斯定理和极大后验假设
3.2.2事件的独立性
3.3贝叶斯分类模型
3.3.1朴素贝叶斯分类
3.3.2贝叶斯网络
3.3.3semi-bayes分类方法
3.3.4tan分类方法
3.4贝叶斯算法应用于文本分类
3.5小结
4朴素贝叶斯文本分类方法及其改进
4.1朴素贝叶斯文本分类方法及其存在的问题
4.1.1朴素贝叶斯文本分类器
4.1.2朴素贝叶斯文本分类器存在的一些问题
4.2相关特征项对文本分类的影响
4.3特征项相关性的度量
4.3.1互信息量
4.3.2互信息在自然语言处理上的应用
4.3.3利用互信息度量特征项之间的相关性
4.4基于特征相关性的朴素贝叶斯文本分类模型
4.5反馈方法应用于贝叶斯文本分类
4.6结论
5分类系统的结构与实现
5.1分类系统的结构与模块说明
5.2系统采用的关键算法
5.2.1特征提取算法
5.2.2分类算法
5.3实验及结果分析
5.3.1实验结果
5.3.2实验结论
6总结和进一步的工作
6.1总结
6.2下一步的工作
致 谢
参考文献
附录