声明
第一章 绪 论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 课题研究的主要内容
1.4本文结构安排
第二章 基础理论知识介绍
2.1 大数据基础
2.2 数据挖掘概述
2.3 网络爬虫技术
2.4 分类算法
2.5 章节小结
第三章 分布式架构Hadoop和Spark对比
3.1引言
3.2分布式架构Hadoop
3.3 分布式架构spark
3.4 hadoop和spark的性能分析
3.5本章小结
第四章 电商数据统计分析
4.1 概述
4.2 网络爬虫的需求分析
4.3 网络爬虫的各个功能模块实现方式
4.4 下单量与时间的关系
4.5 本章小结
第五章 基于Spark的用户风险预测系统的实现
5.1 实验环境
5.2 实验数据处理
5.3 实验结果与分析
5.4本章小结
第六章 总结与展望
6.1 本文工作总结
6.2 本文研究工作展望
参考文献
硕士攻读期间发表论文
致谢