基于FP-growth算法的关联规则挖掘算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机科学与技术的进步，信息技术领域在最近几十年得到了迅猛发展，人们使用信息技术手段在各领域均产生并积累了海量数据，由于数据量以及维度巨大，传统的数据分析方法已经并不奏效，此时，数据挖掘技术应运而生。数据挖掘是从海量的实际应用数据中，挖掘出隐藏的、难以用普通手段发现的，但对现实生活中某些领域的应用具有实际价值的信息的过程。数据挖掘的主要任务之一关联规则的作用在于揭示项集之间的有趣联系，已广泛应用于市场营销、医学、金融、生物等各个领域。FP-growth算法作为关联规则挖掘算法中的一个经典算法，由于不需要产生候选项集，运行效率较Apriori算法有了一定程度上的提高，从而得到了广泛应用。
　　本文针对FP-growth算法产生FP-tree太多、太大，占用内存太多，以及向本地及数据库服务器申请查询重复数据给数据库服务器增加负担的问题，提出了NFP-growth算法。NFP-growth算法通过构造基于支持度二维表的方式存放各项的支持度计数，并且采用基于频繁项集划分的思想，分别得到每个频繁项的数据库子集并从二维表中获取支持度直接构造条件FP-tree，挖掘以该项为结尾的频繁项集。减少了FP-tree的产生数量并将经典FP-growth算法在此过程中遍历每项前缀路径的次数由2次减少为1次。
　　针对FP-growth算法产生频繁项集的过程中会产生大量大于支持度阈值，但人们并不感兴趣的频繁项集的问题，本文在第四章提出的NFP-growth算法的基础上进一步提出了KNFP-growth算法。KNFP-growth算法在NFP-growth算法中融合了关键项抽取KEEP-growth算法的思想，通过划分关键项表和非关键项表，在构造每一项的条件FP-tree后，使用KEEP-growth算法代替FP-growth算法挖掘频繁项集，依靠关键项表的约束，仅输出包含关键项的频繁项集，消除了无意义的频繁项集的挖掘。

著录项

作者
门月;
展开▼
作者单位

中国海洋大学;

展开▼
授予单位中国海洋大学;
学科信号与信息处理
授予学位硕士
导师姓名丁香乾;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 关联规则; FP-growth算法; 频繁项集;

相似文献

中文文献
外文文献
专利

1. 基于FP-GROWTH算法的关联规则挖掘算法研究 [J] . 陈寅 . 无线互联科技 . 2017,第019期
2. 基于FP-growth关联规则的图书馆数据快速挖掘算法研究 [J] . 文芳 ,黄慧玲 ,李腾达 . 重庆理工大学学报 . 2020,第006期
3. 基于FP-growth关联规则的图书馆数据快速挖掘算法研究 [J] . 文芳 ,黄慧玲 ,李腾达 . 重庆理工大学学报（自然科学版） . 2020,第006期
4. 基于增量式FP-Growth算法的关联规则挖掘模型设计 [J] . 高权 ,步新玉 . 信息技术与信息化 . 2020,第003期
5. 基于FP-Growth关联规则算法的接警参数挖掘分析 [J] . 高家明 ,薛京生 ,肖涛 . 软件 . 2013,第008期
6. 基于FP-Growth的关联规则挖掘算法研究 [C] . 李志云 ,周国祥 . 全国第18届计算机技术与应用学术会议(CACIS) . 2007
7. 基于Fp-growth算法的关联规则挖掘算法研究和应用 [A] . 刘喜苹 . 2006

基于FP-growth算法的关联规则挖掘算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅