首页> 外文学位 >Mining Frequent Sequences in One Database Scan Using Distributed Computers.
【24h】

Mining Frequent Sequences in One Database Scan Using Distributed Computers.

机译:使用分布式计算机在一次数据库扫描中挖掘频繁序列。

获取原文
获取原文并翻译 | 示例

摘要

Existing frequent-sequence mining algorithms perform multiple scans of a database, or a structure that captures the database. In this M.Sc. thesis, I propose a frequent-sequence mining algorithm that mines each database row as it reads it, so that it can potentially complete mining in the time it takes to read the database once. I achieve this by having my algorithm enumerate all sub-sequences from each row as it reads it.;Since sub-sequence enumeration is a time-consuming process, I create a method to distribute the work over multiple computers, processors, and thread units, while balancing the load between all resources, and limiting the amount of communication so that my algorithm scales well in regards to the number of computers used. Experimental results show that my algorithm is effective, and can potentially complete the mining process in near the time it takes to perform one scan of the input database.
机译:现有的频繁序列挖掘算法对数据库或捕获数据库的结构执行多次扫描。在这个硕士论文中,我提出了一种频繁序列挖掘算法,该算法在读取每个数据库行时对其进行挖掘,以便它有可能在一次读取数据库的时间内完成挖掘。我通过让我的算法枚举每一行读取的所有子序列来实现这一点。由于子序列枚举是一个耗时的过程,因此我创建了一种方法来将工作分配到多台计算机,处理器和线程单元上,同时平衡所有资源之间的负载,并限制通信量,因此我的算法在使用的计算机数量方面可以很好地扩展。实验结果表明,我的算法是有效的,并且有可能在接近对输入数据库进行一次扫描的时间内完成挖掘过程。

著录项

  • 作者

    Brajczuk, Dale Allan.;

  • 作者单位

    University of Manitoba (Canada).;

  • 授予单位 University of Manitoba (Canada).;
  • 学科 Computer science.
  • 学位 M.Sc.
  • 年度 2011
  • 页码 168 p.
  • 总页数 168
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号