封面
中文摘要
英文摘要
目录
第1章 绪 论
1.1 研究的背景和意义
1.2 国内外研究进展与发展现状
1.3 本文的主要研究内容
1.4 文章的结构安排
第2章 页面更新预测相关基础知识
2.1 爬虫基本概念
2.2 增量爬虫基本概述
2.3 页面更新频率预测算法概述
2.4 本章小结
第3章 基于抽样检测的页面更新频率在线预测算法
3.1 在线预测算法概述,实验数据及评价指标
3.2 基于词向量特征聚类的抽样检测算法
3.3 基于静态特征聚类的抽样检测算法
3.4 基于静态特征以及动态特征聚类的抽样检测算法
3.5 基于聚类的抽样检测算法有效性分析
3.6 本章小结
第4章 自学习的优化算法
4.1 基于在线自学习的页面更新频率预测算法
4.2 采用二进制字符串实现的遗传基因特征集
4.3 格雷码
4.4 采用格雷码实现的遗传基因特征集
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
声明
致谢