首页> 中文学位 >滑动窗口中数据流频繁项集挖掘算法研究
【6h】

滑动窗口中数据流频繁项集挖掘算法研究

代理获取

目录

声明

学位论文的主要创新点

摘要

第一章 绪论

1.1 研究的背景和意义

1.2 国内外的研究现状

1.3 数据流频繁项集挖掘存在的问题

1.4 本文解决的主要问题

1.5 本文研究目的和内容

1.6 本文的组织结构

第二章 数据流挖掘的相关概念

2.1 数据挖掘简介

2.1.1 数据挖掘概念

2.1.2 数据挖掘可挖掘的数据模式

2.2 数据流挖掘简介

2.2.1 数据流及特点

2.2.2 数据流挖掘及难点

2.2.3 数据流挖掘的窗口模型

2.3 频繁项集挖掘

2.3.1 相关的基本概念和性质

2.3.2 挖掘频繁项集的典型算法

2.4 本章小结

第三章 滑动窗口中数据流最大频繁项集挖掘算法研究

3.1 问题描述和相关研究

3.2 SWM-MFI算法描述

3.2.1 算法使用的数据结构

3.2.2 SWM-MFI算法的基本思想

3.3 SWM-MFI算法的流程

3.3.1 滑动窗口初始阶段和滑动阶段

3.3.2 最大频繁项集产生阶段

3.4 实验结果分析

3.4.1 算法的性能分析

3.4.2 算法的性能比较

3.5 本章小结

第四章 滑动窗口中数据流频繁闭项集挖掘算法研究

4.1 引言

4.2 DS-MCFI算法

4.2.1 算法使用的数据结构

4.2.2 DS-MCFI算法的基本思想

4.2.3 DS-MCFI算法的流程

4.3 实验结果和分析

4.4 本章小结

第五章 总结与展望

5.1 研究工作总结

5.2 未来的工作展望

参考文献

发表论文情况

致谢

展开▼

摘要

近年来,随着信息技术的高速发展,变化多样的数据形式使得传统的静态数据挖掘技术已无法适应高速流动的动态的数据挖掘,数据挖掘的发展方向更加深入。数据流就是其中最新出现的很重要的数据形式,在计算机网络、传感器、金融市场、股票交易以及医疗卫生等众多领域得到了广泛的应用,因此数据流挖掘技术成为了当前研究问题的热点。作为关联规则的基础和核心,数据流频繁项集的挖掘更是成为了数据流挖掘领域的一个热点问题。
  数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集,所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义,也受到了业界更多的关注。针对数据流最大频繁项集的挖掘,提出了在滑动窗口中基于矩阵的数据流最大频繁项集挖掘方法SWM-MFI,主要采用两个矩阵来存储数据信息:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集。通过二项集矩阵扩展得到频繁k-项集,基于SWM-MFI算法挖掘出最大频繁项集。经过理论和实验证明该算法具有很好的时效性。
  有些传统的数据流频繁闭项集挖掘算法存在搜索空间大和查找效率低的问题,从而造成算法的时间效率较低。针对以上问题,提出了滑动窗口中数据流频繁闭项集挖掘算法DS-MCFI,首先引入两个矩阵:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集;然后通过二项集矩阵扩展得到频繁k-项集,并通过逻辑与操作得到频繁k-项集的支持度,两个矩阵的相关操作可以明显降低算法的时间复杂度;再将支持度相等的频繁项集存储到数据字典结构中来提高算法的查找效率;最后通过挖掘所有支持度相等的频繁项集中的最大频繁项集组合生成频繁闭项集。经过理论分析和实验证明,DS-MCFI算法具有很好的时空效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号