声明
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 本文主要工作
1.4 本文的组织结构
第二章 相关研究
2.1 网页自动分类概述
2.2 网页预处理
2.3 特征选择
2.4 文本表示模型
2.5 特征权重计算
2.6 分类算法
2.7 本章小结
第三章 大规模网页分类算法设计
3.1 当前网页分类过程存在问题分析
3.2 网页分类算法优化方案
3.3 基于谱哈希的大规模中文网页分类算法设计
3.4 本章小结
第四章 基于谱哈希的大规模网页分类算法实现
4.1 基于谱哈希的大规模中文网页分类算法流程
4.2 网页预处理的实现
4.3 网页预分类的实现
4.4 CW-FS特征选择方法的实现
4.5 网页向量化表示的实现
4.6 基于谱哈希网页向量降维方法的实现
4.7 KNN分类器的实现
4.8 本章小结
第五章 基于谱哈希的大规模网页分类算法测试
5.1 数据集
5.2 测试标准
5.3 优化方案测试
5.4 基于谱哈希的大规模中文网页分类算法测试
5.5 测试分析
第六章 总结与展望
6.1 主要工作总结
6.2 下一步工作展望
致谢
参考文献
作者在学期间取得的学术成果