基于云计算的WEB日志分析系统的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络技术与电子商务技术的迅猛发展,运行在互联网之上的各种应用和服务也随之大量涌现。WEB已成为当今世界上最大的信息系统。作为WEB系统的重要组成部分,WEB日志用于保存人们浏览的网页记录。随着使用WEB系统的人数的急剧增加,WEB日志数量也在飞速的增长。如何通过数据分析技术以及数据挖掘技术,快速的从海量的 WEB日志中提取有意义的信息,成为商业界和学术界关注的重要研究课题。
　　为了能够对WEB日志进行有效的分析和挖掘,人们设计并实现了很多WEB日志分析系统。这些WEB日志分析系统主要是基于单机服务器的,单机服务器无论是CPU的性能、I/O性能还是存储方面的性能,都是非常有限的。对于海量的WEB日志数据而言,仅仅依靠于单机系统进行分析与挖掘已经远远不能满足WEB日志分析的实时性要求。
　　针对这个问题,本文设计并实现了一套基于云计算的海量 WEB日志分析系统,作为典型的云计算应用框架,Hadoop可以利用多个机器实现分布式计算功能,提高WEB日志分析的实时性;同时Hadoop支持分布式存储与并行访问技术,能够加快 WEB日志访问的效率。因此本文研究并实现基于 Hadoop框架的分布式WEB日志分析系统,利用分布式计算和分布式存储,实现对云计算集群中海量数据的分析。
　　具体的说本文主要研究工作包括以下几点:
　　首先,深入学习并掌握 Hadoop的核心技术以及整体框架,包括 HDFS(分布式文件系统)和Map/Reduce(分布式计算框架),理解分布式集群的整体构架。
　　其次,研究如何将传统的串行算法进行并行化设计,使之能够运行在云计算平台之上,加快算法的运行速度,提升系统处理海量数据的能力。本文主要实现WEB日志统计工作的并行化、查询算法的并行化设计。利用MapReduce编程框架实现这些并行算法。
　　最后,设计并实现了一套基于云计算的 WEB日志分析系统,系统主要实现了日志收集模块、日志预处理模块、日志存储模块、日志统计模块和日志查询模块。

著录项

作者
肖俊良;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科软件工程
授予学位硕士
导师姓名屈鸿;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
WEB日志分析系统; 云计算; Hadoop框架; 分布式文件系统; 串行算法;

相似文献

中文文献
外文文献
专利

1. 基于改进k-prototypes算法的Web日志分析系统的设计与实现 [J] . 罗冬梅 . 吉林工程技术师范学院学报 . 2015,第005期
2. 基于Openstack的云计算技术与应用专业Web云盘设计与实现 [J] . 曾新洲 . 电脑知识与技术 . 2018,第020期
3. 基于Web2.0和云计算的协作学习系统设计与实现 [J] . 陈超 ,赵越 . 信息技术 . 2016,第003期
4. 基于google云计算平台的web应用系统设计与实现 [J] . 张丽蓉 . 中国电子商务 . 2014,第020期
5. 基于云计算和WebGIS的铁路运营监控系统的设计与实现 [J] . 闫璐 ,胥昊 ,郭奇园 . 中国铁道科学 . 2012,第0z1期
6. 基于云计算的Web防护体系的设计与实现 [C] . 李守鹏 ,孙焕武 . 第三届全国信息安全等级保护技术大会 . 2014
7. 一个基于Hadoop的Web日志分析系统的设计与实现 [A] . 王恒 . 2014

基于云计算的WEB日志分析系统的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅