基于位运算的关联规则挖掘算法问题研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机技术的快速发展,各类应用系统中积累的数据不断增长。为了进一步利用数据,从大规模数据中发现某些有规律或有价值的信息,数据挖掘技术应运而生。关联规则挖掘是数据挖掘研究领域的重要问题之一,主要用于发现隐藏在数据之间的潜在联系。由于其应用的广泛性,一直是被广泛关注的研究问题。
　　目前,针对关联规则挖掘算法,国内外学者已经取得了大量的研究成果。然而,传统的关联规则挖掘算法仍然存在一些不足:
　　(1)处理数据速度不高,求解支持度过程较慢;
　　(2)在频繁项集挖掘过程中,会产生较多的候选频繁项集,对于大型稠密数据集,将导致内存严重不足。
　　针对以上问题,本文分别以稀疏数据集和稠密数据集作为研究对象,开展相关研究。本文的主要工作及贡献如下:
　　(1)提出一种基于先验位运算的频繁项集挖掘算法。
　　针对支持度求解过程较慢的问题,本文提出一种基于先验位运算的频繁项集挖掘算法。该算法首先将数据转换为垂直数据格式,并利用二进制方式存储到二维数组;其次,使用k-1频繁项集组合成为k-候选项集;接着,对候选项集进行“剪枝”操作;最后,利用深度优先搜索算法确定所有的频繁项集。实验结果表明,该方法可以有效地简化支持度计算,提高算法效率。
　　(2)提出一种基于差集的频繁项集挖掘算法。
　　针对传统频繁项集挖掘算法会产生较多候选中间项集的问题,本文提出了一种基于差集的频繁项集挖掘算法。该算法首先使用位运算方式计算出所有1-项集的支持度;然后,根据2-项集的diffset形式分成若干群,从而获得较高的内存利用率;最后,从不同的分群里面产生k-项集(k>2),该操作可以有效减少判断项集是否频繁的时间。实验结果表明,该算法有效地减少了频繁候选项集的产生数量,提高了内存的使用效率。
　　本文提出的两个算法,分别从简化支持度计算以及提高内存利用率的角度,有效地改善了传统频繁项集挖掘算法的效率。

著录项

作者
张岳;
展开▼
作者单位

山东师范大学;

展开▼
授予单位山东师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名王洪国;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论 ;
关键词
关联规则挖掘; 先验位运算; 频繁项集; 深度优先搜索; 模拟实验;

相似文献

中文文献
外文文献
专利

1. 基于位运算和倒排索引的关联规则挖掘算法 [J] . 黄玉蕾 ,罗晓霞 ,林青 . 电信科学 . 2015 ,第011期
2. 一种基于分治策略与位运算的频繁项集挖掘算法 [J] . 易宗剑 ,彭月英 ,覃晓 . 广西师范学院学报（自然科学版） . 2015 ,第001期
3. 一种基于位运算的频繁闭项集挖掘算法 [J] . 徐嘉莉 ,杨洪军 ,赵茂娟 . 计算机应用研究 . 2013 ,第011期
4. 三维数据集中基于位运算的挖掘算法 [J] . 彭学武 ,王黎明 . 计算机工程 . 2011 ,第006期
5. 基于数组和位运算的频繁项集挖掘算法 [J] . 周国军 ,秦亮曦 . 南昌工程学院学报 . 2010 ,第006期
6. 基于群体智能的通信网络告警关联规则挖掘算法 [C] . 王洋 ,于君 . 2016山西省通信学会学术年会 . 2016
7. 基于位运算的闭频繁项集挖掘算法的研究 [A] . 彭学武 . 2010

基于位运算的关联规则挖掘算法问题研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅