首页> 中文学位 >改进的垂直数据表示的高效频繁项集挖掘算法研究
【6h】

改进的垂直数据表示的高效频繁项集挖掘算法研究

代理获取

目录

文摘

英文文摘

第1章前言

1.1研究背景

1.2研究目的和内容

1.3本文的主要贡献

1.4本文的组织结构

第2章频繁模式挖掘概述

2.1关联规则挖掘

2.2频繁模式挖掘

2.3当前频繁项集挖掘算法的分析

2.4频繁模式挖掘的发展趋势

第3章基于垂直数据表示的HybirdSet算法

3.1垂直数据表示的分析

3.2 HybirdSet算法

3.3仿真实验

3.4 HybirdSet算法的性能分析

第4章改进的HybirdSet+算法

4.1频繁项集的分析

4.2 HybirdSet+算法

4.3仿真实验

4.4 HybirdSet+算法的性能分析

第5章基于正相关的DHybirdSet算法

5.1项集间的相关性分析

5.2 DHybirdSet算法

5.3仿真实验

5.4 DHybirdSet算法的性能分析

第6章总结与展望

6.1全文总结

6.2存在问题与研究前景展望

参考文献

硕士期间的主要工作

致谢

原创性声明

展开▼

摘要

关联规则挖掘是近年来发展十分迅速而且非常活跃的研究领域。它主要应用于发现数据中不同项目或属性之间的有趣联系。随着被收集和存储数据的高速增长,许多业界人士对于从他们的数据库中挖掘关联规则的兴趣愈加浓厚。频繁项集挖掘是关联规则挖掘的基础和核心问题。相关挖掘算法的性能直接影响数据挖掘尤其是关联挖掘的效率和应用范围。为了进一步适应和满足用户不断变化的需求,本文进行了一系列关于提高频繁项集挖掘算法的性能和完善相关功能的研究工作。 本文首先认真地分析和归纳了当前频繁项集挖掘算法的研究成果,并测试和总结出相关算法的实现方法和性能特点,为提出性能和功能更优的频繁项集挖掘算法作好理论准备。然后在提高执行挖掘的效率和消除矛盾或无效规则相关信息这两个方面对当前的高效挖掘算法进行一系列的改进。1)本文提出的HybridSet算法结合了采用垂直数据表示的Eclat和Diffset算法分别善于处理稀疏和稠密数据集的优点。实验证明,HybirdSet算法在分析稀密程度不同的数据集时的性能与Eclat等经典算法的最优性能基本一致甚至更优。2)充分利用频繁项集的相关信息是减少计算候选集的支持度的时间开销的重要途径。实验证明,本文根据这一特点提出的HybirdSet+算法能在很多情况下进一步提高执行频繁项集挖掘任务的效率;3)由于上述算法的结果中存在与矛盾或无效规则相关的频繁项集,本文根据频繁项集和相关度之间的联系对HybirdSet+算法做出相应改进。实验证明,改进后的DHybirdSet算法能在真实数据的分析中减少部分冗余频繁项集的生成。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号