声明
致谢
摘要
1 引言
1.1 项目背景及意义
1.2 DMP发展现状
1.3 本人工作总结
1.4 论文组织结构
2 关键技术介绍
2.1 HDFS功能介绍
2.2 Mapreduce框架介绍
2.3 Hive功能原理介绍
2.4 Spark功能原理介绍
2.5 Git的原理介绍
2.6 Jcseg分词工具
2.7 本章小结
3 DMP系统的可行性分析与需求分析
3.1 系统可行性分析
3.1.1 市场可行性分析
3.1.2 技术可行性分析
3.1.3 经济可行性分析
3.2 系统总体需求概述
3.3 系统功能需求分析
3.3.1 基础层模块功能需求
3.3.2 数据合并功能需求
3.3.3 人群筛选与投影功能需求
3.4 系统非功能需求分析
3.4.1 性能需求
3.4.2 可靠性需求
3.4.3 易用性需求
3.4.4 可扩展性需求
3.5 本章小结
4 系统概要设计
4.1 系统架构设计
4.1.1 基础层模块
4.1.2 数据合并模块
4.1.3 人群筛选与投影模块
4.2 本章小结
5 系统的详细设计与实现
5.1 基础层模块
5.1.1 标签体系设计
5.1.2 日志解析子模块设计
5.1.3 日志解析子模块的实现
5.1.4 用户频道偏好挖掘设计
5.1.5 用户频道偏好挖掘实现
5.1.6 用户偏好Top20子频道挖掘设计
5.1.7 用户偏好Top20子频道挖掘实现
5.1.8 用户广告关键词偏好挖掘设计
5.1.9 用户广告关键词偏好挖掘实现
5.1.10 Hive中的一个UDF函数的实现
5.1.11 数据清洗模块设计
5.1.12 数据清洗模块的实现
5.2 数据合并模块
5.2.1 数据合并模块的设计
5.2.2 数据合并模块的实现
5.3 人群筛选与投影模块的设计与实现
5.3.1 人群筛选管理设计
5.3.2 人群筛选管理接口层详细设计
5.3.3 人群投影管理设计
5.3.4 人群投影管理模块接口详细设计
5.4 本章小结
6 系统的测试与代码审查
6.1 功能测试
6.2 code review规则
6.3 本章小结
7 结论
参考文献
附录A
作者简历
学位论文数据集