第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3研究内容
1.4论文结构
第二章 网络爬虫
2.1通用网络爬虫
2.2网页URL去重
2.3布隆过滤器
2.4天猫网页URL分析
2.5网页URL去重策略的改进
2.6本章小结
第三章 短文本相似度
3.1短文本介绍
3.2短文本相似度相关技术
3.3本章小结
第四章 系统需求分析
4.1 功能性需求
4.2 非功能性需求
4.3 系统可行性分析
4.4本章小结
第五章 系统总体设计
5.1系统设计原则
5.2系统架构设计
5.3功能模块设计
5.4数据库设计
5.5本章小结
第六章 系统详细设计与实现
6.1系统开发环境
6.2软件工程结构
6.3系统功能实现
6.4本章小结
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
攻读硕士期间发表论文情况
攻读硕士学位期间参与的科研项目
致谢
声明