声明
摘要
1 绪论
1.1 研究背景
1.2 国内外现状分析
1.3 本文的主要贡献
1.4 本文的组织结构
2 相关技术介绍
2.1 主机主要特点
2.2 可靠性
2.3 性能和扩展性
2.4 体系架构
2.5 灵活性
2.6 灾备方案
2.7 Hadoop
2.8 HDFS
2.8.1 文件命名空间
2.8.2 异常处理
2.8.3 特点
2.9 MapReduce
2.9.1 介绍
2.9.2 工作原理
2.10 支持向量机
2.10.1 SVM简介
2.10.2 SVM基本原理
2.10.3 SVM的基本算法
3 IBM智慧物流
3.1 IBM智慧物流整体设计
3.2 Memcached集群设计与实现
3.3 DB2与MYSQL双数据库支持设计与实现
4 HADOOP分析及处理大规模日志
4.1 日志处理系统架构
4.2 数据源采集
4.3 MapReduce过程
4.3.1 Map过程
4.3.2 Combine过程
4.3.3 一级Reduce过程
4.3.4 二级Reduce过程
4.4 SVM分析用户行为
4.4.1 SVM训练
4.4.2 SVM分析
5 主动学习分析非登录用户
5.1 主动学习
5.2 不平衡数据
5.3 改进的主动学习算法
5.3.1 高斯核函数
5.3.2 选择引擎优化
5.4 改进算法实验
5.4.1 实验设计
5.4.2 数据集
5.4.3 实验过程及结果分析
5.5 主动学习分析非登录用户数据
结论
参考文献
附录
攻读硕士学位期间发表学术论文情况
致谢