首页> 中文学位 >基于关联规则的分类算法研究及应用
【6h】

基于关联规则的分类算法研究及应用

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1 研究背景

1.2 研究目的和意义

1.3 国内外研究现状

第二章关联规则挖掘算法

2.1经典的Apriori关联规则算法

2.2基于FP-Tree的关联规则算法

2.3基于FP-Tree的关联规则挖掘新思路

2.4条件频繁集挖掘应用的算法比较

2.5本章小结

第三章基于关联规则的分类算法

3.1现有关联规则分类算法

3.2基于类别的关联分类算法的提出

3.3基于类别的关联分类算法的与其他分类方法的比较

3.4本章小结

第四章关联分类算法的剪枝技术

4.1紧规则集的重定义与分析

4.2剪枝技术的分析讨论

4.3本章小结

第五章模糊关联分类算法与应用

5.1属性的模糊划分

5.2基于类别的模糊关联分类算法

5.3客户成长性分析应用

5.4客户成长性分析结论

5.5本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

关联分析是一种在海量数据库中揭示目标潜在关系的重要的数据挖掘方法,在一篮子分析等商业数据挖掘领域得到广泛的应用,关联分析的算法研究在近40年来一直是数据挖掘的重要内容。本文研究了关联分析算法及其在分类问题。 ㈠对Apdori和FP-Growth两种重要的关联规则挖掘方法的优点和缺陷进行了分析,并在此基础上提出了一种由多项集至一项集的横向挖掘思路FP-Length算法,该算法在比Apriori-type算法有很大的速度提升的前提下,有效的解决了FP-Growth漏解的不足,而且在速度和灵活度上突显其非常适合于处理条件关联规则挖掘问题。 ㈡将关联分析算法延伸至分类问题上,创新的提出一种基于类别的关联规则挖掘算法CACA,该算法对数据库中的属性按类别进行预筛选,从而大大减少搜索组合的数目,将关联分类算法传统的“规则挖掘-规则梳理(建立分类器)-分类”的三步骤模式改造为两步骤模式,设计出有序规则树,既缩短了算法耗时,又建立起以紧规则为导向的搜索机制提的能平台。 ㈢对紧规则进行重新定义并证明了新的紧规则定义具有唯一性。结合CACA算法,提出了两条面向分类规则的剪枝规则和一条创新性的面向紧规则集的剪枝规则。紧规则的定义和剪枝规则的提出,在结构上完备了以紧规则为导向的搜索机制和进一步提高了算法的速度。数据试验证明,剪枝技术提高了算法速度,缩小搜索空间。 ㈣结合聚类分析方法对现有的属性模糊划分方法进行改进,使模糊区间更贴近数据分布状态。通过改造CACA算法的存储结结构,成功将模糊机制引入到基于类别的关联规则挖掘算法(CFACA),改善了模糊关联过分类算法的速度性能。最后,将CFACA算法应用到移动通信业的客户成长性问题中,分析其应用效果,并对搜索到的分类规则作为一种经验知识加以分析,探讨客户成长性的特点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号