基于压缩矩阵的关联规则挖掘算法的改进研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息技术的发展，数据信息呈现爆炸式的增长。为了从海量数据中获取有用的信息，数据挖掘成为当今数据库研究方面最具活力的领域。关联规则挖掘是数据挖掘领域一个重要的研究方向，这项技术广泛应用于各大领域，有着极其重要的应用价值。随着数据集的大小和复杂性的增长，如何提高关联规则挖掘算法对大规模数据集的挖掘效率成为关联规则挖掘研究的核心问题。经典的关联规则挖掘算法Apriori算法是当前关联规则挖掘算法研究的热点。基于矩阵的Apriori算法相比Apriori算法减少了扫描数据库的次数，提高了计算支持度计数的效率，但仍然存在候选集过多，矩阵占用内存空间过大等问题。本文针对已有的基于矩阵的Apriori算法的不足，提出了一种改进的基于压缩矩阵的Apriori算法----NCMA。
　　本研究主要内容包括：⑴首先了解关联规则挖掘算法的背景和发展现状，重点探讨了Apriori算法及其改进算法的优缺点，分析了现有基于Apriori的改进算法存在的问题。⑵详细分析了基于矩阵的Apriori算法及其改进算法，发现改进的基于矩阵的Apriori算法仍然存在多次扫描矩阵、为减少候选集数量增加过多额外计算时间、矩阵压缩得不够彻底、挖掘结果的精确度不高、算法设计过于复杂等问题。⑶针对不足之处，提出一种改进的基于压缩矩阵的Apriori算法----NCMA。算法从矩阵存储、项集排序、矩阵压缩、支持度计数的计算、算法结束条件五个方面进行改进，并通过实例分析证明算法的正确性。⑷将NCMA算法和Apriori算法、CM_Apriori_1算法从理论上和实验上进行分析比较，理论和实验结果都证明了NCMA算法能有效地减少扫描矩阵的次数，大大压缩了矩阵规模，减少了候选项集的数目，提高了挖掘频繁项集的效率。该算法在挖掘密集型数据库时比现有的基于矩阵的Apriori算法具有更高的运行效率和可伸缩性。

著录项

作者
罗丹;
展开▼
作者单位

广西大学;

展开▼
授予单位广西大学;
学科计算机软件与理论
授予学位硕士
导师姓名李陶深;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言 ;
关键词
数据挖掘; 关联规则; 压缩矩阵; Apriori算法;

相似文献

中文文献
外文文献
专利

1. 基于矩阵的关联规则挖掘算法研究与改进 [J] . 王娟勤 ,李书琴 . 计算机测量与控制 . 2011 ,第009期
2. 一种基于压缩矩阵的高效关联规则挖掘算法 [J] . 潘俊辉 ,张强 ,王辉 . 计算机与数字工程 . 2019 ,第011期
3. 基于矩阵压缩的加权关联规则挖掘算法 [J] . 肖红光 ,邓国群 ,谭雯 . 测控技术 . 2018 ,第003期
4. 一种基于MapReduce的压缩矩阵关联规则挖掘算法 [J] . 安建瑞 ,王海鹏 ,张龙波 . 重庆理工大学学报（自然科学版） . 2016 ,第002期
5. 一种基于MapReduce的压缩矩阵关联规则挖掘算法 [J] . 安建瑞 ,王海鹏 ,张龙波 . 重庆理工大学学报 . 2016 ,第002期
6. 基于矩阵映射的通信网告警关联规则挖掘算法研究 [C] . 李彤岩 ,李兴明 . 第一届研究生IT创新学术论坛 . 2008
7. 基于压缩矩阵的关联规则挖掘算法研究及其应用 [A] . 曾健 . 2009

基于压缩矩阵的关联规则挖掘算法的改进研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅