首页> 中文学位 >基于FP-growth关联规则挖掘算法的研究与应用
【6h】

基于FP-growth关联规则挖掘算法的研究与应用

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1数据挖掘的定义

1.2数据挖掘的基本步骤

1.3数据挖掘的主要任务

1.3.1数据预处理

1.3.2关联规则

1.3.3分类和预测

1.3.4聚类分析

1.4数据挖掘的研究现状

1.5数据挖掘未来的研究方向和热点

1.6本文的主要工作

1.7论文结构

第2章关联规则及其挖掘算法

2.1基本概念和问题描述

2.2关联规则的分类

2.3关联规则的研究现状

2.4经典的Apriori算法及其改进算法

2.4.1 Apriori算法

2.4.2实例说明

2.4.3 Apriori的性能瓶颈

2.4.4 Apriori改进算法

2.5 FP-growth算法

2.5.1算法描述

2.5.2实例说明

2.5.3 FP-growth算法的性能瓶颈及缺陷

2.6小结

第3章基于FP-growth算法的关联规则改进算法

3.1分解数据库算法

3.1.1分解数据库算法的思想

3.1.2分解数据库算法的过程描述

3.1.3实例说明

3.2基于被约束子树的挖掘算法

3.2.1改进的FP-树

3.2.2基于被约束子树的挖掘算法FPmine

3.3基于分解数据库和不生成条件FP-树的DCFPmine算法

3.3.1 DCFPmine算法

3.3.2实例分析

3.3.3性能分析

3.4小结

第4章DCFPmine算法的应用

4.1应用数据库说明

4.2数据预处理

4.3数据挖掘

4.4挖掘结果分析

4.5小结

第5章总结与展望

5.1本文工作总结

5.2未来工作展望

致谢

参考文献

攻读学位期间的研究成果

展开▼

摘要

关联规则揭示项集间有趣的相联关系,可广泛应用于市场营销、医学、金融、生物、电信、农业等领域,是数据挖掘的重要研究课题。自1993年R.Agrawal,R.Srikant首次提出该问题以来,已出现了许多关联规则挖掘算法。
   其中最经典的关联规则挖掘算法是Apriori算法和FP-growth算法,而FP-growth算法是当前挖掘频繁项集算法中应用最广,并且不需要产生候选项集的关联规则挖掘算法。但是FP-growth算法并不能有效的挖掘大型数据库,并且时间和空间复杂度较高。为了克服这两处不足,本文对FP-growth算法进行了改进,提出了DCFPmine算法。DCFPmine算法首先采用分解数据库的方法,克服了FP-growth算法不能在大型数据库中进行有效挖掘的问题;其次,DCFPmine算法在挖掘过程中采用了基于约束子树的方法,提高了算法在时间和空间方面的效率。实验表明DCFPmine算法无论在时间和空间效率方面,都优于FP-growth算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号