文摘
英文文摘
声明
第一章绪论
1.1研究背景及意义
1.2国内外研究现状
1.2.1国外研究现状
1.2.2国内研究现状
1.2.3网页文本分类需要进一步研究的工作
1.3论文主要研究内容
1.4论文结构
第二章网页文本分类的关键技术
2.1网页文本分类
2.1.1网页文本分类的数学描述
2.1.2网页文本分类的一般过程
2.2网页文本预处理
2.2.1网页文本提取
2.2.2中文分词
2.2.3去停用词
2.2.4文本表示
2.2.5特征选择
2.2.6特征值权重计算
2.3网页文本分类算法
2.4本章小结
第三章融合LSI和SVC的网页文本分类算法
3.1网页特征提取
3.2利用潜在语义索引降维
3.2.1特征矩阵降维
3.2.2特征权重的确定
3.3支持向量聚类的文本聚类
3.3.1支持向量聚类
3.3.2支持向量机训练
3.3.3聚类分配
3.4基于LSI和支持向量聚类的网页文本聚类算法
3.5本章小结
第四章融合LSI和SVC的网页文本分类算法实现与分析
4.1分类网页集准备
4.2实验平台的构建
4.3试验与结果分析
4.3.1试验
4.3.2数据分析
4.4本章小结
第五章总结与展望
5.1总结
5.2展望
参考文献
致谢
攻读硕士期间发表的论文