数据挖掘中决策树分类算法研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

决策树是分类应用中采用最广泛的模型之一。与神经网络和贝叶斯方法相比，决策树无须花费大量的时间和进行上千次的迭代来训练模型，适用于大规模数据集，除了训练数据中的信息外不再需要其他额外信息，表现了很好的分类精确度。其核心问题是测试属性选择的策略，以及对决策树进行剪枝。连续属性离散化和对高维大规模数据降维，也是扩展决策树算法应用范围的关键技术。本文以决策树为研究对象，主要研究内容有： (1) 引入了一种新的降维方法：先对所有条件属性进行重要性排序，再利用神经网络不需先验知识的“黑箱”分类特点，及其分类效能高的优势，对属性进行裁减，选择出对数据分类最有效的若干基本属性，从而达到降维的效果； (2) 提出了加权二分查找算法进行连续属性离散化，该方法克服了传统二分查找方法单纯划分区域，容易陷入局部最大的缺点，且相对简单，易于实现，效率高； (3) 改进了传统的基于信息熵的属性选择标准，在选择测试属性生成决策树时，克服了ID3和C4.5算法选择测试属性时的偏向问题，计算量小，运行时间短，提高了决策树分类器的分类效率； (4) 基于以上三方面工作，对传统决策树进行优化整合，分析了改进算法的流程，并通过实验数据与C4.5算法进行比较，证明了该算法的优势。 (5) 将上述算法应用于一个图像数据挖掘系统，对从图像中提取的特征数据进行训练，生成决策树后，对新特征数据进行分类，透明度高，可移植性强，效果较好。本项研究得到了“十一五”国家科技支撑计划重点项目“综合风险防范(IRG)关键技术研究与示范”(2006BAD20802)的支持。

著录项

作者
冯亚;
展开▼
作者单位

西北大学;

展开▼
授予单位西北大学;
学科计算机软件与理论
授予学位硕士
导师姓名耿国华;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据挖掘; 决策树; 属性降维; 属性选择; 分类算法;

相似文献

中文文献
外文文献
专利

1. 数据挖掘中改进的C4.5决策树分类算法 [J] . 王文霞 . 吉林大学学报（理学版） . 2017,第005期
2. 数据挖掘中决策树分类算法的研究 [J] . 李如平 . 东华理工大学学报（自然科学版） . 2010,第002期
3. 数据挖掘中决策树分类算法的研究与改进 [J] . 但小容 ,陈轩恕 ,刘飞 . 软件导刊 . 2009,第002期
4. 数据挖掘中决策树分类算法的研究与改进 [J] . 但小容 ,陈轩恕 ,刘飞 . 教育技术导刊 . 2009,第002期
5. 决策树分类算法在寿险客户数据挖掘中的应用 [J] . 袁保社 ,仲爱红 . 电脑知识与技术 . 2007,第016期
6. 高校档案管理工作中的一种决策树分类算法研究 [C] . 鲁俐 . 2006北京地区高校研究生学术交流会 . 2006
7. 数据挖掘决策树分类算法的研究与应用 [A] . 张桂杰 . 2005

数据挖掘中决策树分类算法研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅