首页> 外文期刊>WSEAS Transactions on Information Science and Applications >Milling Long High Utility Itemsets in Transaction Databases
【24h】

Milling Long High Utility Itemsets in Transaction Databases

机译:在事务数据库中铣削长时间使用的实用项集

获取原文
获取原文并翻译 | 示例
       

摘要

Existing algorithms for utility mining are column enumeration based, adopt an Apriori-like candidate set generation-and-test approach, and thus are inadequate on datasets with high dimensions or long patterns. To solve the problem, this paper proposes a hybrid model and a row enumeration based algorithm, i.e., inter-transaction, to discover high utility itemsets from two directions: existing algorithms such as UMining [1] can be used to seek short high utility itemsets from the bottom, while inter-transaction seeks long high utility itemsets from the top. By intersecting relevant transactions, the new algorithm can identify long high utility itemsets directly, without extending short itemsets step by step. In addition, new pruning strategies are used to cut down search space; optimization technique is adopted to improve the performance of the intersection of transactions. Experiments on synthetic data show that our method achieves high performance, especially in large high dimensional datasets.
机译:现有的用于实用程序挖掘的算法是基于列枚举的,采用类似于Apriori的候选集生成和测试方法,因此对于具有高维或长模式的数据集是不够的。为了解决这个问题,本文提出了一种混合模型和基于行枚举的算法,即交互,从两个方向发现高效项目集:现有的算法如UMining [1]可用于寻找短的高效项目集。从底部开始,而交互交易则从顶部开始寻找长期的高实用项集。通过相交相关交易,新算法可以直接识别长久的高实用项集,而无需一步一步扩展短项集。另外,使用了新的修剪策略来减少搜索空间。采用优化技术来提高交易交集的性能。对合成数据的实验表明,我们的方法具有很高的性能,特别是在大型高维数据集中。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号