首页> 中文学位 >基于半结构化数据模型的频繁模式挖掘研究
【6h】

基于半结构化数据模型的频繁模式挖掘研究

代理获取

目录

文摘

英文文摘

声明

1引言

1.1课题的意义

1.2数据挖掘技术的现状与发展

1.3本文的结构与工作

2关联规则挖掘技术分析

2.1关联规则挖掘基础知识

2.2最大频繁项集挖掘

2.3关联规则经典算法的介绍

3半结构化数据的频繁项集挖掘

3.1异构数据库环境

3.2半结构化数据

3.3解决半结构化的数据源问题

3.4半结构化数据模型

3.5XML与半结构化数据

3.6XML在Web数据挖掘中的应用

4基于半结构化数据模型的频繁模式挖掘优化算法

4.1频繁模式挖掘优化算法的概念,定义以及理论基础

4.2基于半结构化数据模型的相关研究与分析

4.3利用压缩树的挖掘算法

4.4基于半结构化数据模型优化算法的介绍

4.5算法模拟实验

4.6实验小节

结语

参考文献

附录攻读学位期间发表论文

后记

展开▼

摘要

随着信息技术的发展,数据挖掘技术得到了广泛的关注,这促使业界人士对该项技术进行更为深入的研究。在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研究方向,对它进行深入研究不仅有着重要的理论意义,而且有着极其重要的应用价值。关联规则挖掘算法是关联规则数据挖掘研究中的主要内容,迄今为止己提出了许多高效的关联规则挖掘算法。 频繁项集(Frequent Itemset)的挖掘是数据挖掘中的一个基础和核心问题,具有广泛的应用领域。由于它是数据挖掘过程中最耗时的部分,挖掘算法的好坏直接影响数据挖掘尤其是关联挖掘的效率和应用范围。因此,最大频繁项集挖掘算法的研究具有重要的理论和应用价值。 本文首先对数据挖掘技术的现状与发展进行了分析和总结。然后对关联规则的基础知识做了详尽解释,尤其是在传统环境下的频繁模式挖掘领域中,很多学者在这方面做了大量的研究工作,取得了瞩目的成绩。重点研究了经典Apriori算法和FP-growth算法的思想、实现过程,对两种算法的性能进行了比较。 其次对半结构化环境下,频繁模式挖掘的原理和技术做了详细的阐述。例如:半结构化数据特点,半结构化数据模型,XML技术等。 最后,在分析了现有最大频繁项集挖掘算法的基础上,针对已有算法中有环路,岔路以及构造步骤较多等方面的不足,提出了一个改进的挖掘最大频繁项集的算法,其特点为统一地解决岔路及环路问题,进一步减少构造压缩树的步骤。在仿真试验中可以体现出算法特点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号