首页> 中文学位 >基于核模式的高维数据挖掘算法的研究
【6h】

基于核模式的高维数据挖掘算法的研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 引言

1.2 数据挖掘

1.2.1 数据挖掘概念

1.2.2 数据挖掘功能

1.2.3 数据挖掘流程

1.3 高维数据挖掘

1.5 论文组织结构

第二章 关联规则及其挖掘算法

2.1 关联规则

2.1.1 关联规则概念

2.1.2 关联规则分类

2.1.3 关联规则挖掘步骤

2.2 Apriori算法

2.2.1 Apriori算法的步骤

2.2.2 Apriori算法的描述

2.2.3 Apriori算法的分析

2.3 FP-growth算法

2.3.1 FP-tree的生成

2.3.2 FP-tree的挖掘

2.3.3 FP-growth算法的分析

2.4 本章小结

第三章 基于模式融合的巨型模式挖掘算法

3.1 相关研究

3.2 模式融合算法

3.2.1 相关概念

3.2.2 模式融合技术

3.2.3 存在问题

3.3 巨型模式挖掘算法

3.4 实验及其分析

3.5 本章小结

第四章 巨型模式挖掘算法的应用

4.1 巨型模式挖掘算法应用的研究背景

4.2 巨型模式挖掘算法应用的设计及实现

4.2 巨型模式挖掘算法应用的挖掘过程

4.4 本章小结

第五章 总结与展望

5.1 总结

5.2 后续工作展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

由于在现实世界中存在着大量的高维数据,而这些高维数据与低维数据相比,在许多方面又表现出不同的特征,如果将用于低维数据的挖掘方法直接应用于高维数据,则可能会产生完全不同的结果,因此必须研究适合高维数据挖掘的理论和方法,这对于完善数据挖掘理论以及拓展数据挖掘的应用都有重要的意义。本文对于高维数据的研究集中于频繁模式的挖掘上,主要围绕频繁模式挖掘方法、巨型模式挖掘算法及其应用进行研究,主要工作如下:
  本文详细介绍和分析了经典的关联规则挖掘算法:Apriori算法和FP-growth算法。这两种经典的频繁模式挖掘算法在一定程度上可以压缩搜索空间减少计算量,提高频繁项集逐层产生的效率。然而这类使用候选集渐增的增长策略的算法并不适用于高维数据挖掘。
  本文对模式融合算法进行了详细的分析。模式融合算法,通过合成少量较短的频繁模式形成巨型模式候选,从而在模式搜索空间跳过大量的中型模式以便快速挖掘巨型模式。为了提高挖掘结果的正确率,本文提出了基于模式融合的巨型模式挖掘算法。该算法是在模式融合算法基础上改进种子模式选取方法,不是随机抽取种子模式,而是选取与上一个抽取的种子模式模式距离较远的模式,避免选取同一个巨型模式的核模式。实验结果显示,基于模式融合的巨型模式挖掘算法在运行时间和正确率上都有所提高,其挖掘结果与巨型模式完整集能较好近似。
  最后,本文使用JAVA语言进行了巨型模式挖掘算法的应用系统的设计与实现。讨论了巨型模式挖掘算法在人工合成数据集上的应用,并以mushroom数据为例介绍基于模式融合的巨型模式挖掘算法的挖掘过程。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号