声明
摘要
1.1 研究背景及意义
1.2 国内外研究现状
1.3 相关技术
1.4 主要工作
1.5 论文组织结构
第2章 系统概要设计
2.1 平台整体设计
2.2 数据采集模块
2.3 数据接入模块
2.4 数据分析模块
2.4.1 数据预处理
2.4.2 用户聚类
2.5 本章小结
第3章 系统详细设计
3.1.1 数据结构
3.1.2 采集器设计
3.2 数据接入模块
3.2.1 非关系型数据库的数据接入
3.2.2 关系型数据库的数据接入
3.2.3 文件系统的数据接入
3.3 数据分析模块
3.3.2 数据结构
3.3.3 用户影响力评价模型
3.3.4 用户聚类算法
3.4 本章小结
第4章 系统实现
4.1.1 Spider模块
4.1.2 IP代理模块
4.1.3 模拟登陆模块
4.2 数据接入模块
4.3 数据分析模块
4.3.1 生成基本表
4.3.2 表去重连接
4.3.3 合并相关表
4.3.4 用户聚类
4.4 本章小结
5.1 CM平台搭建
5.1.1 集群分配
5.1.2 离线部署准备
5.1.3 部署CM Server
5.1.4 分发CDH
5.1.5 部署CDH服务
5.2 本章小结
第6章 总结和展望
参考文献
致谢
山东大学;