数据流中基于FP-Tree的频繁项集挖掘算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

对国内外数据流频繁项集挖掘研究情况分析可知，以往的挖掘算法还存在诸多问题。简单的频繁项集挖掘由于没有采用合理的约束思想，挖掘出的频繁项集相当庞大；增量挖掘方法大部分是处理数据流中新到数据的插入，很少涉及过期数据的删除；单纯的频繁项集挖掘忽略了挖掘结果的时间特性。本文针对这些问题，将研究重点放在基于 FP-Tree概要数据结构的数据流频繁项集挖掘算法的研究上，解决这些问题对研究电子商务、商业智能以及市场决策等领域具有重要的意义。
　　本文首先设计了一种数据流中当前频繁闭项集挖掘算法 HCFI，根据滑动窗口模型，有效的限制了过期数据对挖掘结果的影响。该算法采用闭项集增长策略，仅从当前滑动窗口的数据流中挖掘闭项集，增强了挖掘结果的实时性。该算法在处理时间和内存消耗上优于算法CFI-Stream。
　　其次，提出了数据流滑动窗口上的最大频繁项集挖掘方法 SW-MFI。该算法解决了在挖掘结果不要求项集支持度计数的条件下，获取精确频繁项集结果的问题。该算法较算法DSM-MFI具有较好的时间和空间效率。
　　最后，设计了一种数据流中基于约束的频繁项集挖掘算法ConFI-SW。该算法把滑动窗口中的挖掘过程分为两部分：窗口的维护和基于约束的频繁项集挖掘。算法的时间效率和空间效率较以往算法都有所提高。
　　本文使用C语言对上述算法进行实现，使用现实数据集BMS-WebView-1和BMS-WebView-2进行基于滑动窗口的数据流中频繁闭项集和最大频繁项集挖掘，通过对不同处理结果的对比分析，所提出的算法在解决各自的问题上是有效的。

著录项

作者
霍聪;
展开▼
作者单位

燕山大学;

展开▼
授予单位燕山大学;
学科计算机应用技术
授予学位硕士
导师姓名任家东;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据流; FP-Tree算法; 频繁项集; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 基于周期采样的数据流频繁项集挖掘算法研究 [J] . 侯伟 ,杨炳儒 ,吴晨生 . 高技术通讯 . 2009,第008期
2. 不确定数据流最大频繁项集挖掘算法研究 [J] . 刘慧婷 ,候明利 ,赵鹏 . 计算机工程与应用 . 2016,第019期
3. 滑动窗口中数据流最大频繁项集挖掘算法研究 [J] . 尹绍宏 ,单坤玉 ,范桂丹 . 计算机工程与应用 . 2015,第022期
4. 数据库和数据流频繁项集挖掘算法研究 [J] . 孙莉 . 现代机械 . 2007,第005期
5. 基于有序FP-tree的最大频繁项集挖掘算法 [J] . 李少华 ,吕志旺 ,车德勇 . 东北师大学报：自然科学版 . 2016,第2期
6. 数据流中基于位向量的最大频繁项集挖掘 [C] . 任家东 ,张爱国 ,何海涛 . 第三届中国计算机网络与信息安全学术会议（CCNIS2010） . 2010
7. 基于FP-Tree的最大频繁项集挖掘算法研究 [A] . 王芳 . 2013

数据流中基于FP-Tree的频繁项集挖掘算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅