基于Hadoop框架网络用户浏览器使用行为分析系统研究及实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网的快速发展和网络用户的急剧增加使得Web日志飞速增长。如何从海量Web日志数据中挖掘出有用的信息不仅成为了当前数据挖掘的热点，而且也是摆在多数企业面前的难题。传统基于单一节点的Web挖掘系统的存储和计算能力早已不能有效处理规模庞大的Web日志数据。因此采用分布式存储和计算已经成为当前Web日志挖掘发展的必然趋势。Hadoop是当前使用较为广泛的分布式存储和计算框架。Hadoop分布式计算框架的高可靠性、高扩展性、高容错性等优点使其成为当前海量数据处理的利器，在多个领域中得到了大规模应用。
　　本论文运用Hadoop分布式架构和Web日志挖掘技术实现了一个网络用户浏览器使用行为分析系统。系统通过挖掘海量Web日志数据研究用户浏览器使用行为，从而为网站开发者提供支持，辅助其处理浏览器兼容问题。论文的主要工作和工作成果如下:
　　(1)实现系统整体架构设计。论文从目前课题研究的现实问题出发，结合Hadoop分布式架构和Web日志挖掘技术，按照Web日志数据挖掘的流程，设计了分布式数据存储、分布式数据分析和数据展示三大功能模块。
　　(2)实现Web日志数据的收集和预处理。Web日志数据是系统处理分析的数据源。本文主要通过页面植入代码的技术实现Web日志数据的收集，同时完成Web日志的预处理，确保日志中记录的完整性。
　　(3)实现了并行编程模型的开发。论文根据收集上来Web日志数据的特点，编写了Map和Reduce函数，使系统能聚焦到每条日志记录中浏览器信息并且识别出浏览器类型。
　　(4)完成了Hadoop分布式平台的搭建。在配置好硬件和软件环境的基础上，论文完成了Hadoop环境配置和配置文件的编辑，成功搭建起了Hadoop分布式平台。
　　(5)完成了系统性能测试和计算结果分析应用。论文测试系统处理每M数据所用时间和集群加速两大性能指标，并且对系统测试得到的计算结果进行了分析应用，辅助网站开发者处理浏览器兼容问题。
　　系统性能测试结果表明论文中搭建起Hadoop分布式系统能够有效处理海量Web日志数据，能够有效研究网络用户浏览器使用行为习惯。系统计算得到的结果具有较高的应用价值，能够为网站开发者处理浏览器兼容问题提供有力支持。

著录项

作者
刘强;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科计算机技术
授予学位硕士
导师姓名陶军,李国锋;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.092;
关键词
Hadoop框架; 网络用户; Web日志挖掘; 浏览器使用行为分析系统;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop的电商用户行为分析系统设计与实现 [J] . 陈伟 . 宿州教育学院学报 . 2021,第003期
2. 基于用户使用网络行为分析的主动网络安全模型 [J] . 李卫 . 计算机工程与应用 . 2002,第012期
3. 基于Hadoop的抖音平台用户行为分析系统模型研究 [J] . 魏超 . 黑龙江科技信息 . 2021,第024期
4. 基于Hadoop的抖音平台用户行为分析系统模型研究 [J] . 魏超 . 科学技术创新 . 2021,第024期
5. 基于Hadoop的大数据用户行为分析系统 [J] . 于淑云 ,林姝敏 . 北京信息科技大学学报：自然科学版 . 2018,第5期
6. 基于异常话务处理的用户行为分析系统研究方案 [C] . 黄桂东 ,周德山 . 2016年河南省通信学会学术年会 . 2016
7. 基于MongoDB的网络用户行为分析系统研究与实现 [A] . 史茜 . 2017

基于Hadoop框架网络用户浏览器使用行为分析系统研究及实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅