首页> 外文会议>International Conference on Data Mining >A New Algorithm for Discovery Maximal Frequent Itemsets
【24h】

A New Algorithm for Discovery Maximal Frequent Itemsets

机译:一种发现最大频繁项目集的新算法

获取原文

摘要

Frequent itemsets mining plays an important role in data mining research for over a decade. However, the mining of the all frequent itemsets will lead to a massive number of itemsets. Fortunately, this problem can be reduced to the mining of maximal frequent itemsets. In this paper, we propose a new method for mining maximal frequent itemsets. Our method introduces an efficient database encoding technique, a novel tree structure called PC_Tree and also PC_Miner algorithm. The database encoding technique utilizes Prime number characteristics and transforms each transaction into a positive integer that has all properties of its items. The PC_Tree is a simple tree structure but yet powerful to capture whole of transactions by one database scan. The PC_Miner algorithm traverses the PC_Tree to mine maximal frequent itemsets. Experiments verify the efficiency and advantages of the proposed method.
机译:频繁的项目挖掘在十年内在数据挖掘研究中发挥着重要作用。但是,所有频繁项目集的挖掘将导致大量的项目集。幸运的是,这个问题可以减少到最大频繁项目集的挖掘。在本文中,我们提出了一种新的挖掘最大频繁项目集的方法。我们的方法介绍了一个有效的数据库编码技术,一种名为PC_Tree的新型树结构,也是PC_MINER算法。数据库编码技术利用素数特征,并将每个事务转换为具有其项目所有属性的正整数。 PC_Tree是一个简单的树结构,但仍然强大,可以通过一个数据库扫描捕获整个事务。 PC_MINER算法将PC_TREE遍历到MINE最大频繁项目集。实验验证了所提出的方法的效率和优点。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号