首页> 美国卫生研究院文献>other >A Node Linkage Approach for Sequential Pattern Mining
【2h】

A Node Linkage Approach for Sequential Pattern Mining

机译:顺序模式挖掘的节点链接方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Sequential Pattern Mining is a widely addressed problem in data mining, with applications such as analyzing Web usage, examining purchase behavior, and text mining, among others. Nevertheless, with the dramatic increase in data volume, the current approaches prove inefficient when dealing with large input datasets, a large number of different symbols and low minimum supports. In this paper, we propose a new sequential pattern mining algorithm, which follows a pattern-growth scheme to discover sequential patterns. Unlike most pattern growth algorithms, our approach does not build a data structure to represent the input dataset, but instead accesses the required sequences through pseudo-projection databases, achieving better runtime and reducing memory requirements. Our algorithm traverses the search space in a depth-first fashion and only preserves in memory a pattern node linkage and the pseudo-projections required for the branch being explored at the time. Experimental results show that our new approach, the Node Linkage Depth-First Traversal algorithm (NLDFT), has better performance and scalability in comparison with state of the art algorithms.
机译:顺序模式挖掘是数据挖掘中一个广泛解决的问题,其应用程序包括分析Web使用情况,检查购买行为和文本挖掘等。但是,随着数据量的急剧增加,当前的方法在处理大型输入数据集,大量不同的符号以及最低支持率较低时被证明是低效的。在本文中,我们提出了一种新的顺序模式挖掘算法,该算法遵循模式增长方案来发现顺序模式。与大多数模式增长算法不同,我们的方法不是建立表示输入数据集的数据结构,而是通过伪投影数据库访问所需的序列,从而实现了更好的运行时间并减少了内存需求。我们的算法以深度优先的方式遍历搜索空间,并且仅在内存中保留模式节点链接和当时正在探索的分支所需的伪投影。实验结果表明,与最新算法相比,我们的新方法“节点链接深度优先遍历”算法(NLDFT)具有更好的性能和可伸缩性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号