Efficient Probabilistic Frequent Itemset Mining in Big Sparse Uncertain Data

机译：大稀疏不确定数据中的概率概率频繁项集挖掘

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Probabilistic frequent itemset (PFI) mining in uncertain data has been drawing increasing attention from data mining communities recently. However, data generated in network environments, such as machine logs and retail transactions, tends to be big, sparse and uncertain due to the influence of random factors including unavoidable network latency, unfaithful collection and unreliable transmission, etc. Therefore, most available PFI mining algorithms are not adequately effective on dealing with uncertain data which is greatly big and extremely sparse. To address this issue, we propose a novel tree structure, ApproxFP-Tree and a parallelized ApproxFP algorithm based on the MapReduce platform aiming to mine all PFIs in big, sparse and uncertain data efficiently. Experimental results on real-world and synthetic databases are illustrated and analyzed to show that our approach is significantly efficient than the state-of-the-art algorithms.

机译：最近，不确定数据中的概率频繁项集（PFI）挖掘已引起数据挖掘社区越来越多的关注。但是，由于随机因素（包括不可避免的网络延迟，不忠实的收集和不可靠的传输等）的影响，在网络环境中生成的数据（例如机器日志和零售交易）往往会很大，稀疏和不确定。因此，大多数可用的PFI挖掘这些算法在处理不确定性数据时效率不高，不确定性数据非常大且极为稀疏。为了解决这个问题，我们提出了一种新颖的树结构，ApproxFP-Tree和基于MapReduce平台的并行化ApproxFP算法，旨在有效地挖掘大数据，稀疏数据和不确定数据中的所有PFI。举例说明并分析了在现实世界和合成数据库上的实验结果，表明我们的方法比最新的算法有效得多。

著录项

来源
《Pacific Rim international conference on artificial intelligence》|2014年|235-247|共13页
会议地点
作者
Jing Xu; Ning Li; Xiao-Jiao Mao; Yu-Bin Yang;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Probabilistic frequent itemset; MapReduce; frequent itemset mining; uncertain data;

机译：概率频繁项集; MapReduce;频繁的项目集挖掘;不确定的数据;

相似文献

外文文献
中文文献
专利

1. Efficient weighted probabilistic frequent itemset mining in uncertain databases [J] . Li Zhiyang, Chen Fengjuan, Wu Junfeng, Expert Systems . 2021,第5期

机译：在不确定数据库中有效的加权概率频繁漏洞挖掘
2. Probabilistic maximal frequent itemset mining methods over uncertain databases [J] . Li Haifeng, Hai Mo, Zhang Ning, Intelligent data analysis . 2019,第6期

机译：概率最大频繁的项目集挖掘方法在不确定数据库中
3. Probabilistic frequent itemset mining over uncertain data streams [J] . Haifeng Li, Ning Zhang, Jianming Zhu, Expert Systems with Application . 2018,第DECa期

机译：不确定数据流上的概率频繁项集挖掘
4. Efficient Probabilistic Frequent Itemset Mining in Big Sparse Uncertain Data [C] . Jing Xu, Ning Li, Xiao-Jiao Mao, Pacific Rim International Conference on Artificial Intelligence . 2014

机译：大稀疏不确定数据中有效的概率频繁项目集挖掘
5. Mining Frequent Itemsets from Uncertain Data: Extensions to Constrained Mining and Stream Mining. [D] . Hao, Boyu. 2010

机译：从不确定的数据中挖掘频繁项集：约束挖掘和流挖掘的扩展。
6. An efficient pattern growth approach for mining fault tolerant frequent itemsets [O] . Shariq Bashir -1

机译：挖掘容错频繁项集的有效模式增长方法
7. Approximation to expected support of frequent itemsets in mining probabilistic sets of uncertain data [O] . Cuzzocrea Alfredo, Leung Carson K., Mackinnon Richard Kyle 2015

机译：挖掘不确定数据的概率集中频繁项集的预期支持的近似值

Efficient Probabilistic Frequent Itemset Mining in Big Sparse Uncertain Data

摘要

著录项

相似文献

相关主题

期刊订阅