基于粗集与位阵的关联规则挖掘算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

作为数据库研究领域中的热点，数据库中的知识发现(简称KDD)正在受到越来越多的关注。它被定义为在数据中寻找正确的、有趣的、潜在有用的并最终可以理解的模式。对关联规则的挖掘在许多数据挖掘任务中都有重要作用，有着广泛的应用范围。随着被挖掘的数据集在大小和复杂度上的飞速增长，研究高效可伸缩的挖掘算法对保证系统的可伸缩性和交互性至关重要。关联规则挖掘算法使用格理论中的组合特性来将原始问题分解为许多更小的互相独立的问题。最有名的和最有影响力的算法包括Apriori算法和FP-growth算法。粗集理论根据对一个系统的观察和测量所得的现实数据信息，从分类的观点，以集合近似、近似分类与不可分辨的概念为基础，通过知识约简从中发现、推理知识和分辨系统的特点、过程、预测系统的结果等。DM_R算法尝试利用粗集理论中关于等价类的概念，针对单维布尔关联规则问题提出的一种挖掘算法，并利用兴趣度对规则进行评价。DM_R算法借助不可分辨关系的概念，将事务数据库按照交易集合划分等价类。该算法从k-候选项集中可以直接产生k-频繁项集，同时还可以生成(k+1)-候选项集而无需搜索数据库，因此DM_R算法只需在生成1-候选项集时对数据库进行一次搜索，这会大大减少计算时间。通过对各项交易设定不同的MIF值，用户可以灵活控制不同的关联规则的最小支持度阈值，可以发现包含非频繁交易的具有较低支持度的关联规则以及具有较高支持度的包含频繁交易的关联规则，同时又不会引入过多无意义规则。由于现实世界事务数据库中，数据是随时间的变化而变化的，当前已发现的最大频繁项集可能不再生效，而新的有效最大频繁项集有待于重新去发现。因此，迫切需要设计高效的算法来管理、维护和更新已挖掘出来的最大频繁项集。目前国内外在对这一问题的相关研究中提出了Pincer Search、IUA、FIUA、FUFIA、FUMFIA等算法，这些算法主要是针对频繁模式树来进行单双向剪枝与重构，需要额外的存贮空间和较大的运算开销。对此，本文提出了一种增量式更新最大频繁项集算法FAUMFI(Fast A1gorithm for Updating Maximum Frequent Itemsets)，该算法将充分利用已有的一切信息(如旧的最大频繁项集、原来的BitMatrix等)，以高效地发现最新事务数据库中所有的最大频繁项集，并分析了算法的效率。

著录项

作者
胡斌;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科计算机应用技术
授予学位硕士
导师姓名蒋外文;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据库; 数据挖掘; 关联规则; 挖掘算法;

相似文献

中文文献
外文文献
专利

1. 基于粗集理论的教学评估关联规则挖掘研究 [J] . 王爱侠 . 教育教学论坛 . 2014,第053期
2. 基于粗集理论的分类关联规则挖掘研究 [J] . 张文宇 ,薛惠锋 ,张洪才 . 西安石油大学学报（自然科学版） . 2002,第004期
3. 基于关联规则挖掘的粗糙集属性值约简算法研究 [J] . 杜跃 ,王治和 ,景永霞 . 苏州科技学院学报（自然科学版） . 2008,第001期
4. 基于粗糙集的分类关联规则挖掘算法研究 [J] . 尹世群 ,余建桥 ,葛继科 . 计算机科学 . 2007,第012期
5. 基于幂集的关联规则挖掘算法研究 [J] . 闫炜 ,崔杜武 ,付长龙 . 计算机工程与应用 . 2004,第001期
6. 一种基于位向量的关联规则挖掘算法 [C] . 郭云峰 ,张集祥 . 2008年中国信息技术与应用学术论坛 . 2008
7. 基于粗集理论的关联规则挖掘研究 [A] . 史月美 . 2006

基于粗集与位阵的关联规则挖掘算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅