声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 Web日志挖掘研究
1.2.2 Hadoop分布式系统研究
1.2.3 浏览器兼容性问题及其解决方案研究
1.3 主要研究内容
1.4 组织结构
第二章 Hadoop技术框架及Web日志挖掘理论基础
2.1 Hadoop技术架构理论基础
2.1.1 Hadoop整体介绍
2.1.2 Hadoop分布式文件系统
2.1.3 MapReduce
2.2 Web日志挖掘
2.2.1 Web日志挖掘定义
2.2.2 Web日志挖掘流程
2.2.3 Web日志挖掘的主要方法
2.3 本章小结
第三章 网络用户浏览器使用行为分析系统需求分析
3.1 存在问题分析
3.1.1 Web日志挖掘问题
3.1.2 浏览器兼容问题
3.2 系统需求分析
3.3 网络用户浏览器使用行为分析系统功能概述
3.4 本章小结
第四章 网络用户浏览器使用行为分析系统的实现
4.1 数据存储模块的实现
4.1.1 日志收集
4.1.2 数据预处理
4.1.3 导入DFS
4.2 数据分析模块的实现
4.2.1 统计指标
4.2.2 分析计算
4.2.3 导出HDFS
4.3 数据展示模块的实现
4.4 本章小结
第五章 网络用户浏览器使用行为分析系统的部署与测试
5.1 分布式平台的搭建
5.1.1 硬件环境
5.1.2 软件环境
5.1.3 Hadoop平台的安装部署
5.2 系统运行过程及结果分析
5.2.1 系统运行前准备工作
5.2.2 系统运行
5.2.3 系统运行结果分析
5.3 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
东南大学;