基于项目邻接表与事务树的频繁项集挖掘算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘技术是解决数据丰富而知识贫乏的有效途径，是信息科学领域的前沿研究课题之一，已被公认为是数据库研究中一个极富应用前景的领域。在众多的数据挖掘算法中，挖掘关联规则是数据挖掘领域中的重要研究内容，其中挖掘频繁项集又是挖掘关联规则的关键问题之一。Apriori算法、FP-growth算法和Eclat算法是经典的频繁项集挖掘算法，但在候选项集的产生、扫描数据库的次数及内存要求方面仍然存在着一定的问题。在分析了经典算法的基础上，本文主要在以下几个方面研究了基于矩阵的关联规则挖掘算法。
　　首先，针对现有频繁项集挖掘算法中产生大量的候选项集和扫描数据库次数过多的问题，结合向量运算理论和项目邻接表，把事务数据库中的各个项目组织到项目邻接表中，提出了一次性产生频繁项集的基于项目邻接表的频繁项集挖掘算法。
　　其次，针对现有算法在寻找最大频繁项集的过程中需多次扫描数据库，侯选项集过多，支持度计算过于复杂等问题。把事务数据库中的各个项目组织到事务树中，通过遍历事务树能直接快速的找到最大频繁项目集。
　　最后，传统算法在生成关联规则时，生成的关联规则之间存在着大量的冗余和无效的规则，或者漏掉了一些有用的规则。针对这些问题，提出了一种有效关联规则挖掘算法，在该算法中，增加了新的关联规则度量标准——参考置信度，能够生成用户感兴趣的有效关联规则。

著录项

作者
郑为夷;
展开▼
作者单位

燕山大学;

展开▼
授予单位燕山大学;
学科计算机应用技术
授予学位硕士
导师姓名张忠平;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据挖掘; 频繁项集; 事务树; 项目邻接表; 关联规则;

相似文献

中文文献
外文文献
专利

1. 基于事务树的最大频繁项集挖掘算法 [J] . 张忠平 ,郑为夷 . 计算机工程 . 2009,第015期
2. 一种基于邻接表的最大频繁项集挖掘算法 [J] . 殷茗 ,王文杰 ,张煊宇 . 电子与信息学报 . 2019,第008期
3. 基于迭代事务集与交集剪枝的最大频繁项集挖掘算法 [J] . 刘黎明 ,王水 ,王乐 . 南开大学学报（自然科学版） . 2009,第004期
4. 一种基于单事务项集组合的频繁项集挖掘算法 [J] . 曾波 . 计算机科学 . 2008,第001期
5. 基于树堆的频繁项集挖掘算法 [J] . 向春梅 ,陈超 . 电脑知识与技术 . 2019,第003期
6. CFPM:一种基于压缩FP-树的频繁项集挖掘算法 [C] . 陈飞 ,李铭 ,商琳 . 第十一届中国人工智能学术年会 . 2005
7. 基于频繁模式树的最大频繁项集挖掘算法研究 [A] . 徐峰 . 2009

基于项目邻接表与事务树的频繁项集挖掘算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅