声明
摘要
第1章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.3 论文主要工作及创新
1.4 论文的组织结构
第2章 课题相关理论
2.1 搜索引擎工作原理
2.2 常见作弊手段
2.3 垃圾链接
2.4 网页排序算法
2.4.1 HITS算法
2.4.2 PageRank算法
2.4.3 BadRank算法
2.4.4 TrustRank算法
2.5 本章小结
第3章 垃圾网页检测的关键算法
3.1 基于内容重构网络链接拓扑
3.1.1 特征选择与分析
3.1.2 相关性分析
3.1.3 重构网络链接拓扑
3.2 双向游走模型的垃圾网页检测算法TDRank
3.2.1 基本思想
3.2.2 种子集选择与赋值
3.2.3 TDRank算法
3.3 本章小结
第4章 实验与分析
4.1 数据集
4.2 TrustRank重构链接拓扑实验分析
4.3 TDRank算法实验与分析
4.3.1 TDRank算法对垃圾网页检测的有效性
4.3.2 TDRank算法的鲁棒性
4.3.3 种子节点的选取与分析
4.4 TDRank重构链接拓扑实验分析
4.5 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
发表论文和参加科研情况说明
致谢