首页> 中文期刊> 《计算机科学》 >不确定性数据上频繁项集挖掘的预处理方法

不确定性数据上频繁项集挖掘的预处理方法

     

摘要

传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息.通过研究频繁模式增长树的算法原理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth.利用主成分分析的方法进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝.在理论研究基础上,通过实验对数据集进行了验证.结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用.%Traditional studies of frequent itemset mining cannot obtain information from uncertain data efficiently. We studied the frequent pattern tree and proposed an effective uncertain data preconditioning method, the PCAFP-Growth, which can reduce the itemset dimensions with principal component analysis method,and prune data with fuzzy association analysis. Our experimental results over real world datasets show that our method is effective and efficient

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号