基于Hadoop的Apriori算法改进与移植的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

目的：
　　随着计算机技术和互联网的飞速发展,Web2.0的成熟与广泛应用,数据呈现爆炸式增长,传统的数据挖掘算法在处理海量数据时效率低下,云计算的出现为其改进带来了新的方式。云计算通过集群威力,实现了对海量数据的可靠存储和高速计算。Hadoop作为一款比较成熟的开源云计算框架,以其高效、可扩展、低成本等优点在数据挖掘的相关领域得到了广泛应用。基于此,本文将Hadoop与典型的数据挖掘系统进行整合,并选择了新的数据挖掘系统的算法模块部分中应用较为广泛的Apriori算法进行改进,以提高其在处理海量数据时的效率。
　　方法：
　　本文采用的研究方法包括:文献研究法,结构化方法,实例分析法和对比分析法。文献研究法可以了解相关研究的现状,还为本文的研究提供理论参考;结构化方法是系统分析常用的方法,对基于Hadoop的云数据挖掘系统架构的分析具有指导意义;通过实例分析法阐述了传统Apriori算法的执行流程并论证了改进算法的可行性;通过对比分析法,分析了改进算法的优势。
　　结果：
　　(1)结合典型的数据挖掘系统架构,将其与Hadoop进行整合,提出了基于Hadoop的数据挖掘系统架构,并对各个功能模块进行了简要阐述。
　　(2)在对Apriori算法进行了详细阐述的基础上,针对其在处理海量数据时存在的瓶颈,利用MapReduce编程模式,本文提出了基于数据库划分的并行化改进的思想。通过对改进算法的详细阐述和设计,结合实例论证了改进算法的可行性,并对改进算法进行了分析。
　　(3)通过实例分析,得到改进算法具有更高的效率,降低了时间复杂度和空间复杂度。
　　结论：
　　(1)云计算给数据挖掘算法的改进带来了新的方式,云数据挖掘将成为未来的研究趋势。
　　(2)本文的研究具有一定的意义,它为数据挖掘其它算法的改进提供了参考。越来越多的算法将被并行化移植到Hadoop云数据挖掘平台。

著录项

作者
朱安柱;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科情报学
授予学位硕士
导师姓名郭一平;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类情报工作自动化、网络化;
关键词
云计算框架Hadoop; Apriori算法; 数据挖掘系统; 空间复杂度;

相似文献

中文文献
外文文献
专利

1. 基于事务子集的Apriori算法改进研究 [J] . 艾菊梅 ,程一民 ,徐瑞斌 . 电脑编程技巧与维护 . 2020,第009期
2. 基于布尔矩阵约简的Apriori算法改进研究 [J] . 廖纪勇 ,吴晟 ,刘爱莲 . 计算机工程与科学 . 2019,第012期
3. 基于Apriori算法的协同过滤算法改进研究 [J] . 文健鑫 ,黄志杰 ,凌利民 . 电脑编程技巧与维护 . 2018,第004期
4. 一种基于fp-tree的Apriori算法改进研究 [J] . 倪政君 ,夏哲雷 . 中国计量大学学报 . 2018,第001期
5. 一种基于fp-tree的Apriori算法改进研究 [J] . 倪政君 ,夏哲雷 . 中国计量学院学报 . 2018,第001期
6. 一种基于压缩矩阵的Apriori算法改进研究 [C] . LUO Dan ,罗丹 ,LI Tao-shen . 第四届全国智能信息处理学术会议 . 2013
7. 基于Hadoop平台的Apriori算法改进研究 [A] . 宣正邦 . 2020

基于Hadoop的Apriori算法改进与移植的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅