首页> 中文学位 >数据流闭合频繁模式挖掘算法的研究
【6h】

数据流闭合频繁模式挖掘算法的研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1论文研究的目的和意义

1.2国内外研究现状

1.3论文主要工作内容和组织结构

第2章数据流频繁模式挖掘的研究

2.1数据流概述

2.1.1传统数据与数据流的比较

2.1.2数据流结构

2.1.3数据流模型

2.2数据流挖掘的研究

2.2.1数据流挖掘概述

2.2.2数据流挖掘模型

2.2.3数据流挖掘技术

2.3频繁模式挖掘的研究

2.3.1数据流频繁模式挖掘特点

2.3.2频繁模式挖掘算法

2.4闭合频繁模式挖掘的研究

2.4.1闭合频繁模式挖掘概述

2.4.2闭合频繁模式挖掘算法

2.5本章小结

第3章基于Moment的改进闭合模式挖掘算法

3.1 Moment算法

3.1.1 Moment算法分析

3.1.2 Moment算法存在的不足

3.2改进闭合频繁模式挖掘算法

3.2.1相关概念描述

3.2.2项目的表示方法

3.2.3包含索引的生成

3.2.4闭合频繁模式挖掘

3.2.5闭合频繁模式更新

3.3基于Moment的改进闭合模式挖掘算法描述

3.4本章小结

第4章实验分析

4.1实例结果分析

4 2模拟数据集下测试分析

4.2.1测试数据集的选取

4.2.2实验分析

4.3本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

数据流的出现引发了人们对数据流处理技术的广泛研究。数据流频繁模式挖掘技术就是其中的一种,它在商务决策、知识库的应用中起着重要的作用。但是由于数据流本身动态多变、无限性的特点,全部频繁模式挖掘存在着数据和项集冗余的问题,挖掘算法的时间和空间复杂度一般较大。Pasquier提出了闭合频繁模式的概念可以惟一确定所有的频繁模式并且数量要小得多,因此闭合频繁模式挖掘的研究具有更重要的意义。 本文从研究对象数据流入手,首先介绍了有关数据流的相关知识包括数据流结构、模型和数据流挖掘技术;其次对以数据流为基础的频繁模式和闭合模式挖掘算法进行研究分析,针对Moment算法闭合模式的搜索空间较大,更新数据容易颠簸的不足等缺点,提出了基于Moment的改进闭合模式挖掘算法,该算法是基于二进制表示法和事务滑动窗口的改进算法。算法给出一种自定义的BitVec—gen结构,引入初始生成子概念直接挖掘闭合模式而无需存储其它的频繁模式,同时利用二进制表示的项目之间的位与操作简化支持数的计算,通过二进制移位操作实现项目在滑动窗口中的更新。 该算法利用二进制表示法对数据流中的事务和项目进行水平和垂直两个方向上的压缩以节省内存空间,引入传统的闭合模式挖掘算法直接对闭合模式挖掘减少算法的搜索空间,提高算法的挖掘效率。文章最后通过实例分析以及合成数据进行实验,由对比结果可知该算法在保证挖掘结果的同时,在时间和空间上可以有更高的效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号