声明
摘要
第1章 绪论
1.1 研究背景和意义
1.2 研究现状
1.2.1 搜索引擎排序算法
1.2.2 垃圾网页分类
1.2.3 垃圾网页检测技术
1.3 研究内容
1.4 论文的结构安排
第2章 相关知识与研究
2.1 人工免疫系统的背景及相关概念
2.1.1 人工免疫系统的产生和发展
2.1.2 人工免疫系统的相关概念
2.1.3 人工免疫系统的仿生机理
2.2 人工免疫系统常用算法
2.2.1 一般免疫算法
2.2.2 阴性选择算法
2.2.3 克隆选择算法
2.3 人工免疫系统的特点
2.4 数据集WEBSPAM-UK2006
2.5 不平衡数据集的分类问题
2.6 评价指标
2.7 本章小结
第3章 基于免疫克隆选择的垃圾网页检测
3.1 引言
3.2 基于免疫克隆选择的垃圾网页检测框架
3.3 特征选择
3.3.1 基于x2的特征选择
3.3.2 基于信息增益的特征选择
3.4 样本及个体的表示
3.5 形态空间与亲和力函数
3.6 适应度函数
3.7 克隆算子与变异算子
3.8 克隆选择分类算法
3.8.1 克隆选择分类算法描述
3.8.2 克隆选择分类算法分析
3.9 基于免疫克隆选择的垃圾网页检测
3.10 算法的性能评价
3.10.1 不平衡数据集上的实验
3.10.2 平衡数据集上的实验
3.11 本章小结
第4章 基于改进免疫克隆选择的垃圾网页检测
4.1 引言
4.2 改进的克隆选择分类算法
4.2.1 CSCA算法的不足
4.2.2 改进的克隆选择分类算法描述
4.3 基于改进的克隆选择分类算法的垃圾网页检测
4.3.1 算法流程
4.3.2 算法描述
4.4 实验与分析
4.4.1 实验参数设置
4.4.2 实验一
4.4.3 实验二
4.4.4 实验三
4.4.5 实验四
4.4.6 结果讨论
4.5 本章小结
第5章 利用免疫克隆选择的集成学习方法检测垃圾网页
5.1 引言
5.2 集成学习
5.3 利用Bagging方法构建组合分类器
5.3.1 处理流程
5.3.2 算法描述
5.4 利用Bagging方法集成免疫克隆选择分类器检测垃圾网页检测框架
5.5 实验与分析
5.6 本章小结
总结与展望
总结
下一步工作
致谢
参考文献
攻读硕士学位期间发表的论文