封面
声明
中文摘要
英文摘要
目录
第1章 绪论
1.1 课题来源
1.2 课题研究背景及意义
1.3 国内外研究现状
1.4 论文研究的主要内容
1.5 论文组织结构
第2章 Web中文文本分类主要技术
2.1 Web中文文本预处理
2.2 Web文本特征提取
2.3 文本数学表示方法
2.4 Web文本权重计算
2.5 Web文本分类算法
2.6 本章小结
第3章 Web中文文本采集系统设计
3.1 Web文本特点分析
3.2 试验样本采集系统设计
3.3建立试验样本库
3.4 本章小结
第4章 Web中文文本特征选择研究及改进
4.1 文本特征选择概述
4.2 Web文本处理思路改进
4.3 处理思路改进前后试验与结果分析
4.4 卡方统计概述
4.5 分析卡方统计的不足
4.6 卡方统计的改进
4.7 卡方统计改进前后试验与结果分析
4.8 本章小结
第5章 KNN文本分类算法研究及改进
5.1 KNN分类算法概述
5.2 KNN算法分类步骤探究
5.3 相似度的计算
5.4 分析KNN文本分类算法缺点
5.5 KNN文本分类算法的改进
5.6 KNN改进前后试验与结果分析
5.7 本章小结
第6章 Web中文文本分类系统设计
6.1 系统开发环境
6.2 系统实现框图
6.3 Web网页采集系统
6.4 分类系统模块
6.5 结果评价系统
6.6 本章小结
第7章 总结与展望
7.1 本文总结
7.2 研究展望
致谢
参考文献