首页> 中文学位 >决策树优化与关联规则挖掘算法研究
【6h】

决策树优化与关联规则挖掘算法研究

代理获取

目录

文摘

英文文摘

声明

第1章 绪 论

1.1研究背景

1.2国内外研究现状

1.2.1关联规则挖掘算法的研究现状

1.2.2决策树分类算法的研究现状

1.3研究内容及论文组织结构

第2章 关联规则与决策树方法概述

2.1数据挖掘相关知识

2.1.1数据挖掘的定义

2.1.2数据挖掘过程

2.1.3数据挖掘的方法

2.2关联规则理论

2.2.1频繁项集挖掘算法

2.2.2规则的兴趣度度量和相关性分析

2.3决策树理论

2.3.1属性选择度量标准

2.3.2决策树剪枝方法

2.4本章小结

第3章 基于约束的频繁闭项集挖掘算法

3.1长度递减支持度约束的频繁项集挖掘算法

3.1.1基本概念

3.1.2算法存在的问题

3.2 ACLCMiner算法

3.2.1长度递减支持度约束

3.2.2前后件约束

3.2.3复合型频繁模式树和Rtree树

3.2.4剪枝策略

3.2.5 ACLCMiner算法描述

3.3实验结果及分析

3.3.1 UCI数据的实验结果

3.3.2冠心病诊疗数据的实验结果

3.4本章小结

第4章 基于变精度粗糙集的决策树分类算法

4.1粗糙集理论

4.2变精度粗糙集模型

4.3基于变精度粗糙集的决策树改进算法

4.3.1基于VPRS属性选择标准

4.3.2结点停止分裂条件和类标预测方法

4.3.3 CGVPRSDT算法描述

4.4实验结果及分析

4.5本章小结

第5章 构建多值属性多类标决策树

5.1多值属性多类标决策树的问题描述

5.1.1多值属性多类标数据的描述

5.1.2多值属性多类标决策树的基本问题描述

5.2 L_MMDT算法

5.2.1基于相似度的属性选择标准

5.2.2结点停止分裂条件

5.2.3 L_MMDT算法描述

5.3实验结果及分析

5.3.1实验设计

5.3.2实验结果

5.4本章小结

第6章 结论与展望

6.1结论

6.2展望

参考文献

攻读学位期间公开发表论文

致谢

展开▼

摘要

数据挖掘技术是人工智能和机器学习的重要研究领域。目前,相关挖掘方法的研究主要集中在特征提取、属性约简、算法效率、分类精度、特定领域背景下的相关方法改进及应用等多个方面。在众多的数据挖掘方法中,关联规则挖掘方法和决策树分类方法具有算法计算量小、运行时间短、生成的结果易于理解等优点,因此在理论研究及实际应用方面拥有广阔的发展前景。为此,本文通过对现有相关算法的深入分析和研究,提出了相应的改进算法,并采用UCI数据进行对比测试,取得了较好的实验效果。其中,主要研究工作包括如下三个方面:
   (1)传统的频繁项集挖掘算法会生成大量的短模式集,但是实际上用户真正感兴趣是长模式集生成的规则。因此,本文提出了一种基于前后件约束和长度递减支持度约束的频繁闭项集生成算法(ACLCMiner)。实验证明该算法极大地减少了频繁项集的生成数量并提高了算法效率。
   (2)现有的决策树算法存在属性选择困难、易受噪声数据影响和泛化能力低等不足。而基于变精度粗糙集构建的决策树算法具有较好的分类效果,且能够容忍噪声数据。为此,本文分析了现有的基于变精度粗糙集的决策树算法,针对其中存在的不足,提出了一种综合考虑了当前结点的加权近似精度、信息增益和属性取值个数的属性选择标准——属性重要度。基于该标准的决策树算法CGVPRSDT能够有效提高分类准确率。
   (3)针对现有的多值属性多类标决策树分类算法的不足,本文提出了新的多值属性和多类标数据的决策树算法。算法中提出了一种基于非噪声类标集的相似度计算公式,该公式综合考虑了类标集的相似性以及噪声数据的影响。另外,算法改进了原有的结点停止分裂条件。实验证明改进的多值属性多类标决策树算法具有较高的分类精度和抗噪声能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号