首页> 中文学位 >基于变精度粗糙集的决策树分类算法研究
【6h】

基于变精度粗糙集的决策树分类算法研究

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 论文研究背景

1.2 国内外研究现状

1.3 论文组织结构

第2章 属性约简和决策树方法概述

2.1 数据挖掘相关介绍

2.1.1 数据挖掘的定义

2.1.2 数据挖掘的过程

2.1.3 数据挖掘的方法

2.1.4 数据挖掘的应用

2.2 属性约简理论

2.2.1 属性约简概述

2.2.1 核的求解

2.2.2 属性选择标准

2.3 决策树分类

2.3.1 分裂属性选择标准

2.3.2 决策树的剪枝方法

2.4 本章小结

第3章 基于变精度粗糙集的属性约简算法

3.1 粗糙集理论

3.2 变精度粗糙集

3.3 基于变精度粗糙集的属性约简改进算法

3.3.1 基于变精度粗糙集的属性选择方法

3.3.2 基于变精度粗糙集的属性约简改进算法描述

3.3.3 示例说明

3.4 实验结果与分析

3.5 本章小结

第4章 基于变精度粗糙集的决策树算法研究

4.1 决策树的定义及分类过程

4.2 决策树分类相关理论基础

4.2.1 信息论知识

4.2.2 基于变精度粗糙集的分类知识

4.3 基于变精度粗糙集的决策树分类改进算法

4.3.1 基于VPRS的分裂属性选择标准

4.3.2 结点停止分裂条件和类别预测方法

4.3.2 算法描述

4.4 实验结果及分析

4.5 本章小结

第5章 基于变精度粗糙集的属性约简及决策树改进算法在冠心病中医临床诊疗中的应用

5.1 冠心病相关介绍

5.1.1 冠心病的危害

5.1.2 中医药防治冠心病的独特优势

5.1.3 智能技术应用于中医药防治冠心病临床研究的现状

5.2 冠心病数据预处理

5.2.1 常用数据离散方法

5.2.2 冠心病数据

5.3 实验结果与分析

5.4 本章小结

第6章 结论与展望

6.1 结论

6.2 展望

参考文献

致谢

展开▼

摘要

数据挖掘自上世纪80年代后期出现以来,经过二十多年的发展,现在已成为机器学习和人工智能这两大热门领域的重要研究内容。特征属性提取、冗余属性约简、分类精度和算法效率的提高以及相关算法针对某特定领域或背景的改进和应用都是目前数据挖掘的研究重点。在数据挖掘的所有方法中,决策树分类算法以其计算量小、容易理解、运行结果直观易懂等优点,受到众多学者关注。所以,本文通过对相关领域现有算法的深入研究,针对属性约简和决策树分类存在的不足,做出相应的改进,并选择多个UCI数据集做对比实验,取得不错的效果。具体来说,主要研究内容包括以下三个方面:
   (1)在进行属性约简时,现有算法所采用的重要属性选择标准倾向于选择取值个数较多的属性,而没有考虑属性取值的有效性。因此,本文提出了一种新的重要属性选择标准,该标准使用了支持度对属性的有效取值进行统计,并将有效取值个数和β逼近精度综合作为衡量属性重要性的标准。
   (2)本文针对现有决策树分类算法存在的对噪声数据敏感和分裂属性选择困难等不足,结合变精度粗糙集能够容忍噪声数据的优点,提出了一种新的分裂属性选择标准,该标准从变精度明确区和信息论的角度进行综合考虑,使得改进算法构造的决策树既能有效抵抗噪声数据又具有较高的正确分类率。另外,通过引入置信度和支持度的概念实现在决策树构建过程中的预剪枝,可以有效降低树的规模;将匹配度应用到对测试数据的类标号预测中,提高分类精度。
   (3)将经过属性提取、数据预处理等步骤的冠心病中医诊疗病例作为实验数据。首先进行属性约简,挖掘出对冠心病有影响的因素;然后使用约简后的数据构建决策树,提取决策规则,实现对冠心病病例样本的中医症型分类。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号