首页> 外文会议> >DSM-TKP: mining top-k path traversal patterns over Web click-streams
【24h】

DSM-TKP: mining top-k path traversal patterns over Web click-streams

机译:DSM-TKP:通过Web点击流挖掘top-k路径遍历模式

获取原文

摘要

Online, single-pass mining Web click streams poses some interesting computational issues, such as unbounded length of streaming data, possibly very fast arrival rate and just one scan over previously arrived click-sequencer In this paper, we propose a new, single-pass algorithm, called DSM-TKP (data stream mining for top-k path traversal patterns), for mining top-k path traversal patterns, where k is the desired number of path traversal patterns to be mined. An effective summary data structure called TKP-forest (top-k path forest) is used to maintain the essential information about the top-k path traversal patterns of the click-stream so far. Experimental studies show that DSM-TKP algorithm uses stable memory usage and makes only one pass over the streaming data.
机译:在线单遍挖掘Web点击流带来了一些有趣的计算问题,例如流数据的无限长度,可能非常快的到达速度以及仅对先前到达的点击序列器进行一次扫描。在本文中,我们提出了一种新的单遍一种算法,称为DSM-TKP(用于top-k路径遍历模式的数据流挖掘),用于挖掘top-k路径遍历模式,其中k是要挖掘的所需路径遍历模式数。有效的摘要数据结构称为TKP-forest(top-k路径林),用于维护到目前为止单击流的top-k路径遍历模式的基本信息。实验研究表明,DSM-TKP算法使用稳定的内存使用率,并且仅对流数据进行一次传递。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号