首页> 中文学位 >基于项目邻接表与事务树的频繁项集挖掘算法
【6h】

基于项目邻接表与事务树的频繁项集挖掘算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题的研究背景与意义

1.2 国内外研究现状

1.3 本文的研究内容

1.4 论文的组织结构

第2章 关联规则挖掘

2.1 数据挖掘的概念及挖掘方法

2.2 关联规则的基本概念及描述

2.3 本章小结

第3章 基于项目邻接表的频繁项集挖掘算法

3.1 频繁项集经典算法分析

3.2 IAL算法设计与实现

3.3 IAL-Apriori算法实验分析

3.4 本章小结

第4章 基于事务树的最大频繁项集挖掘算法

4.1 引言

4.2 前期工作

4.3 TT-Apriori算法设计

4.4 实验分析

4.5 本章小结

第5章 基于参考置信度的关联规则挖掘算法

5.1 引言

5.2 关联规则度量标准分析

5.3 ARMC算法设计

5.4 实验分析

5.5 本章小结

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

作者简介

展开▼

摘要

数据挖掘技术是解决数据丰富而知识贫乏的有效途径,是信息科学领域的前沿研究课题之一,已被公认为是数据库研究中一个极富应用前景的领域。在众多的数据挖掘算法中,挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘频繁项集又是挖掘关联规则的关键问题之一。Apriori算法、FP-growth算法和Eclat算法是经典的频繁项集挖掘算法,但在候选项集的产生、扫描数据库的次数及内存要求方面仍然存在着一定的问题。在分析了经典算法的基础上,本文主要在以下几个方面研究了基于矩阵的关联规则挖掘算法。
  首先,针对现有频繁项集挖掘算法中产生大量的候选项集和扫描数据库次数过多的问题,结合向量运算理论和项目邻接表,把事务数据库中的各个项目组织到项目邻接表中,提出了一次性产生频繁项集的基于项目邻接表的频繁项集挖掘算法。
  其次,针对现有算法在寻找最大频繁项集的过程中需多次扫描数据库,侯选项集过多,支持度计算过于复杂等问题。把事务数据库中的各个项目组织到事务树中,通过遍历事务树能直接快速的找到最大频繁项目集。
  最后,传统算法在生成关联规则时,生成的关联规则之间存在着大量的冗余和无效的规则,或者漏掉了一些有用的规则。针对这些问题,提出了一种有效关联规则挖掘算法,在该算法中,增加了新的关联规则度量标准——参考置信度,能够生成用户感兴趣的有效关联规则。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号