封面
声明
中文摘要
英文摘要
目录
1 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 主要研究内容
1.4 本文结构
2 分布式多媒体爬行系统设计
2.1 网络爬虫基本原理
2.2 网络爬虫设计目标
2.3 分布式网络爬虫架构设计
2.4 任务调度与负载均衡
2.5 本章小结
3 网络爬虫关键技术研究与实现
3.1 爬行策略
3.2 URL判重
3.3 多线程同步
3.4 更新策略
3.5 本章小结
4 多媒体抓取模块实现与系统评测
4.1 普通多媒体资源获取
4.2 视频分享网站地址解析
4.3 系统运行评测
4.4 本章小结
5 总结与展望
致谢
参考文献
附录 攻读学位期间的研究成果与参研项目