首页> 外文会议> >H-mine: hyper-structure mining of frequent patterns in large databases

【24h】

H-mine: hyper-structure mining of frequent patterns in large databases

机译：H-mine：大型数据库中频繁模式的超结构挖掘

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Methods for efficient mining of frequent patterns have been studied extensively by many researchers. However, the previously proposed methods still encounter some performance bottlenecks when mining databases with different data characteristics, such as dense vs. sparse, long vs. short patterns, memory-based vs. disk-based, etc. In this study, we propose a simple and novel hyper-linked data structure, H-struct and a new mining algorithm, H-mine, which takes advantage of this data structure and dynamically adjusts links in the mining process. A distinct feature of this method is that it has very limited and precisely predictable space overhead and runs really fast in memory-based setting. Moreover it can be scaled up to very large databases by database partitioning, and when the data set becomes dense, (conditional) FP-trees can be constructed dynamically as part of the mining process. Our study shows that H-mine has high performance in various kinds of data, outperforms the previously developed algorithms in different settings, and is highly scalable in mining large databases. This study also proposes a new data mining methodology, space-preserving mining, which may have strong impact in the future development of efficient and scalable data mining methods.

机译：许多研究人员已经广泛研究了有效挖掘频繁模式的方法。但是，先前的方法在挖掘具有不同数据特征的数据库时仍然会遇到一些性能瓶颈，例如密集与稀疏，长与短模式，基于内存与基于磁盘等。在这项研究中，我们提出了一个简单新颖的超链接数据结构H-struct和新的挖掘算法H-mine，该算法利用了这种数据结构并在挖掘过程中动态调整了链接。此方法的独特之处在于它具有非常有限且可精确预测的空间开销，并且在基于内存的设置中运行速度非常快。此外，可以通过数据库分区将其扩展到非常大的数据库，并且当数据集变得密集时，（有条件的）FP树可以作为挖掘过程的一部分动态构建。我们的研究表明，H-mine在各种数据中均具有高性能，在不同的环境下性能优于先前开发的算法，并且在挖掘大型数据库时具有高度可扩展性。这项研究还提出了一种新的数据挖掘方法，即空间保留挖掘，它可能对有效和可扩展数据挖掘方法的未来发展产生重大影响。

著录项

来源
《》|2001年|P.441-448|共8页
会议地点
作者
Jian Pei; Jiawei Han; Hongjun Lu;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类无线电电子学、电信技术;
关键词

相似文献

外文文献
中文文献
专利

1. Hmine-rev: Toward H-mine Parallelization on Mining Frequent Patterns in Large Databases [J] . Bowo PRASETYO, Iko PRAMUDIONO, Masaru KITSUREGAWA, 電子情報通信学会技術研究報告. デ-タ工学. Data Engineering . 2005,第172期

机译：Hmine-rev：在大型数据库中挖掘频繁模式时实现H-mine并行化
2. Hmine-rev: Toward H-mine Parallelization on Mining Frequent Patterns in Large Databases [J] . Bowo PRASETYO, Iko PRAMUDIONO, Masaru KITSUREGAWA 電子情報通信学会技術研究報告. デ-タ工学. Data Engineering . 2005,第172期

机译：Hmine-rev：在大型数据库中挖掘频繁模式时实现H-mine并行化
3. H-Mine: Fast and space-preserving frequent pattern mining in large databases [J] . JIAN PEI, JIAWEI HAN, HONGJUN LU, IIE Transactions . 2007,第6期

机译：H-Mine：大型数据库中快速且节省空间的频繁模式挖掘
4. H-mine: hyper-structure mining of frequent patterns in large databases [C] . Jian Pei, Jiawei Han, Hongjun Lu, IEEE International Conference on Data Mining . 2001

机译：H-矿：大型数据库中频繁模式的超结构挖掘
5. Efficient frequent pattern mining over probabilistic databases. [D] . Tong, Yongxin. 2013

机译：通过概率数据库进行有效的频繁模式挖掘。
6. Hyper-structure mining of frequent patterns in uncertain data streams [O] . Chandima HewaNadungodage, Yuni Xia, Jaehwan John Lee, -1

机译：不确定数据流中频繁模式的超结构挖掘
7. H-Mine: Hyper-Structure Mining of Frequent Patterns in Large Databases [O] . Jian Pei, Jiawei Han, Hongjun Lu, 2001

机译：H矿：大型数据库中频繁模式的超结构挖掘

H-mine: hyper-structure mining of frequent patterns in large databases

摘要

著录项

相似文献

相关主题

期刊订阅