封面
中文摘要
英文摘要
目录
1 绪论
1.1课题研究的背景与意义
1.2国内外研究现状
1.3本文的研究内容
1.4论文的组织结构
2 网页结构特点与网页去噪技术
2.1网页DOM树
2.2网页DOM树的解析
2.3网页去噪技术
2.4本章小结
3 基于分类方法的网页去噪
3.1常用分类方法
3.2分类方法的对比
3.3网页去噪分类模型
3.4本章小结
4 网页特征的提取与表示
4.1文本与标题相似度
4.2文本长度比
4.3链接文字比
4.4网页的标签特征
4.5本章小结
5 实验过程及评价
5.1数据获取与解析工具
5.2实验数据集
5.3实验及评价准则
5.4结果及其分析
5.5特征选择
5.6本章小结
6 总结与展望
参考文献
攻读硕士学位期间完成论文
致谢
声明