文摘
英文文摘
郑重声明
第一章 引言
1.1课题研究的背景和意义
1.2国外研究状况
1.3国内研究状况
1.4主要工作与本文的结构
第二章 文本自动分类的相关模型
2.1文本自动分类的定义
2.2分类常用模型
2.2.1向量空间模型(VSM,Vector Space Model)
2.2.2潜在语义索引(LSI)模型
2.2.3贝叶斯概率模型
2.3自动分类常用算法介绍
2.3.1中心向量法
2.3.2朴素贝叶斯方法(Naive Bayes)
2.3.3 K-近邻算法(KNN)
2.3.4支持向量机(SVM)
第三章 文本自动分类器构造
3.1文本预处理
3.2文本特征描述
3.2.1特征提取
3.2.2特征重构
3.3分类器构造
3.3.1训练文本特征项权重计算
3.3.2待分类文本特征项权重计算
3.3.3分类器构造算法
3.4阈值的确定
3.5文本自动分类系统的结构框架
第四章 实验设置与结果分析
4.1实验用语料库
4.1.1国家语委现代汉语平衡语料库
4.1.2新浪网网页语料
4.2实验环境
4.3实验评测标准
4.4实验项目
4.5实验结果分析
4.6网页自动分类实验
第五章 分类器算法的改进
5.1改进算法
5.2实验结果分析
第六章 结论与展望
6.1全文总结
6.2展望
致谢
硕士阶段参加的课题与发表的论文
参考文献