面向离散属性的决策树分类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘是指在大量已存在的数据中发现规律的一个过程。近年来，在大量数据中智能提取知识已经引起了业界广泛的关注。数据挖掘领域包括分类、聚类、聚簇、关联分析等各种挖掘方法。决策树算法因它提取知识简单、高效、易于理解等优点，在数据挖掘领域中占有无可替代的地位。在已有的决策树算法中，计算决策树分裂结点的标准大多以香农的信息熵为基础，信息熵需反复地进行对数运算，分类效率不高。又因已有算法在选择候选结点时的随机性，使分类器无法进一步选择判断属性分裂标准相同时的情况，进而降低预测分类的准确率。
　　本研究主要内容包括：⑴针对已有决策树算法分类效率不高的问题，为避免复杂的对数运算，提高CPU的利用率，提出了改进的属性判断标准的优化函数。对比实验显示该优化函数能有效提高分类效率和CPU的利用率。⑵针对生成后的决策树分类器精确率低的问题，为避免当两个或更多的属性判断标准的计算值接近某个阈值或相等，随机选择一个结点作为下一个属性分裂的结点，进一步引入了一个基于堆的属性判断方法，以此来提高分类精确率。通过实验验证，该方法可以有效提高某些特定数据集的分类精确率。⑶针对决策树分类精确率不高以及过度拟合的问题，引入了基于分类规则的方法。利用改进的决策树算法N次随机抽样生成N个决策树分类器，再从这些分类器中挑选出最优的分类规则，生成最终的决策树模型。经过实验验证，该算法相比已有算法，在分类效率和分类准确率上都有相应的提高。

著录项

作者
赵柯;
展开▼
作者单位

大连海事大学;

展开▼
授予单位大连海事大学;
学科计算机科学与技术
授予学位硕士
导师姓名刘智;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
信息检索; 数据挖掘; 决策树分类; 程序语言;

相似文献

中文文献
外文文献
专利

1. 面向属性值遗漏数据决策树分类算法研究 [J] . 邱云飞 ,李雪 ,王建坤 . 计算机科学 . 2011,第010期
2. 面向属性值遗漏数据决策树分类算法研究 [J] . 邱云飞 ,李雪 ,王建坤 . 计算机科学与探索 . 2011,第010期
3. 水产品安全信息系统中属性离散化方法研究 [J] . 鄂旭 ,杨健 ,王欣铨 . 计算机技术与发展 . 2014,第007期
4. 基于正态分布特征的连续属性无监督离散化方法研究 [J] . 李晓宏 ,孙林岩 ,李刚 . 科学与管理 . 2009,第006期
5. 数值属性离散化方法研究 [J] . 梁红旗 . 信息技术 . 2008,第005期
6. 面向分类规则的数值属性离散化 [C] . 胡学钢 ,顾广宇 ,王志海 . 第五届全国计算机应用联合学术会议 . 1999
7. 面向不确定性数据的决策树分类方法研究 [A] . 秦旭东 . 2017

面向离散属性的决策树分类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅