基于HADOOP平台的并行关联规则算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在数据挖掘研究领域中，关联规则算法因其具有目的明确、实现灵活、应用范围广泛等特点成为挖掘数据深层价值的重要手段。在大数据时代，如何能够以更低的成本以及更高效准确的从海量数据中挖掘出有价值的信息，以帮助决策者更加科学的制定决策已成为数据挖掘领域的新课题。
　　云计算的出现为海量数据挖掘带来了新的解决方案。Hadoop是由Apache基金会开源实现的一种云计算技术，它的关键技术是Hadoop分布式文件系统和MapReduce并行编程框架。在深入研究传统数据挖掘算法的基础上，如何结合新的框架对传统据挖掘算法进行改进使之能够处理海量数据挖掘问题，是数据挖掘领域的一个热点。
　　本文首先详细研究了云计算、Hadoop的分布式文件系统HDFS以及MapReduce并行编程框架。然后，对数据挖掘和关联规则概念进行了阐述，并对关联规则中的经典的Apriori算法进行了详细的分析研究，并在此基础之上给出了算法的一个具体实例，然后将Apriori算法结合Hadoop平台进行并行化实现。在以上研究内容的基础之上，通过引入矩阵的数据结构，根据矩阵的特点以及Apriori算法的性质提出了基于Hadoop和矩阵的关联规则挖掘改进算法。最后，搭建Hadoop的实验环境，用java编程语言完成改进算法的代码编写并调试，通过采用不同的实验数据集和实验条件对算法进行测试。通过实验结果的对比分析，得出改进算法具有更好的性能。

著录项

作者
马连灯;
展开▼
作者单位

天津工业大学;

展开▼
授予单位天津工业大学;
学科计算机技术
授予学位硕士
导师姓名王占刚,王泽恒;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
数据挖掘; 关联规则算法; 云计算; 分布式系统基础架构;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop平台的并行化数据分类算法研究 [J] . 黄黎 ,顾筠 . 制造业自动化 . 2014 ,第014期
2. 基于 Hadoop平台的并行特征匹配算法研究 [J] . 李宝禄 ,张伟 . 计算机应用研究 . 2014 ,第011期
3. 基于哈希树的并行关联规则挖掘算法研究 [J] . 吉祥 ,黄树成 . 计算机与数字工程 . 2020 ,第007期
4. 基于Spark的并行关联规则挖掘算法研究综述 [J] . 刘莉萍 ,章新友 ,牛晓录 . 计算机工程与应用 . 2019 ,第009期
5. 基于MapReduce计算模型的并行关联规则挖掘算法研究综述 [J] . 肖文 ,胡娟 ,周晓峰 . 计算机应用研究 . 2018 ,第001期
6. 关联规则并行算法研究与实践 [C] . 王华秋 ,王越 ,曹长修 . 第8届全国并行计算大会 . 2004
7. 基于Hadoop平台并行关联规则挖掘算法研究 [A] . 张玲 . 2017

基于HADOOP平台的并行关联规则算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅