基于位运算的闭频繁项集挖掘算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在信息技术高度发达的今天，现实生活和商业应用中积累了大量历史数据，而且这些数据正呈爆炸式增长。海量的历史数据既蕴含着大量宝贵资源，同时也把我们淹没在数据和信息的汪洋大海里。为了从中找到潜在的、有价值的信息，数据挖掘技术应运而生，并显示出强大的生命力和巨大的发展潜力。频繁模式挖掘在数据挖掘任务中一直充当着重要的角色，频繁模式挖掘是一个相对耗时的过程，而且可能会产生大量的频繁模式项，挖掘频繁闭模式比频繁模式数量上要少，但是却能表达相同的信息。
　　频繁项集挖掘做为关联规则产生的首要步骤，其挖掘效率的高低直接关系着关联规则产生的总体效率。本文将位处理技术运用到二维闭频繁项集挖掘和三维闭频繁项集挖掘过程中，对数据集和项集按位存储，通过充分利用计算机每次处理32位数据的特性，最大限度的提高每次运算处理数据集的数据量，从而提高闭频繁项集挖掘的效率。
　　本文在对现有的各种二维频繁项集挖掘算法和三维频繁项集挖掘算法优缺点进行分析比较的基础上，对枚举策略和剪枝策略进行优化，设计出更加高效的基于位运算的二维闭频繁项集挖掘算法BD-Miner和基于位运算的三维闭频繁项集挖掘算法BD-Peeler，使得算法既继承了现有算法的优点，又能更高效的完成挖掘任务。
　　本文使用VC++6.0实现了算法BD-Miner和BD-Peeler，在多个数据集上做了大量实验，并与现有算法进行了比较，实验结果表明：在相同数据集上完成相同约束条件的闭频繁项集的挖掘任务，二维数据集上BD-Miner算法能提升挖掘效率6-7倍，三维数据集上BD-Peeler算法能提升挖掘效率3倍。

著录项

作者
彭学武;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机软件与理论
授予学位硕士
导师姓名王黎明;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
位运算; 频繁项集挖掘算法; 闭频繁项集; 数据集; 频繁模式挖掘; 挖掘效率; 信息技术; 数据挖掘技术; 三维; 关联规则; 二维; 任务; 数据的特性; 总体效率; 约束条件; 挖掘过程; 首要步骤; 实验; 商业应用; 剪枝策略;

相似文献

中文文献
外文文献
专利

1. 一种基于分治策略与位运算的频繁项集挖掘算法 [J] . 易宗剑 ,彭月英 ,覃晓 . 广西师范学院学报（自然科学版） . 2015,第001期
2. 基于数组和位运算的频繁项集挖掘算法 [J] . 周国军 ,秦亮曦 . 南昌工程学院学报 . 2010,第006期
3. 一种基于位运算的频繁闭项集挖掘算法 [J] . 徐嘉莉 ,杨洪军 ,赵茂娟 . 计算机应用研究 . 2013,第011期
4. MRClose：一种基于MapReduce的并行闭频繁项集挖掘算法 [J] . 胡娟 ,肖文 . 电子技术与软件工程 . 2017,第022期
5. 一种基于后缀项表的并行闭频繁项集挖掘算法 [J] . TANG Ying-feng ,CHEN Shi-ping . 计算机应用研究 . 2014,第002期
6. 基于关联规则中闭频繁项集的我所论文作者合著关系研究 [C] . 杨策 ,李彦文 . 中国中医科学院中医药信息研究所2010年学术年会 . 2011
7. 分布式环境下的闭频繁项集挖掘算法研究 [A] . 徐杰 . 2014

基于位运算的闭频繁项集挖掘算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅