基于决策树的教育信息挖掘模型（DT-EIDM）的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

高等学校多年来的教学和管理中积累了大量的数据，目前这些数据还没有得到有效地利用，只是一个待开发的“宝藏”。数据挖掘可以从大量的数据中提取隐藏在数据背后的有价值信息，在越来越多的领域得到应用，取得了较好的效果，为人们作出正确的决策提供了很大的帮助。为了有效利用高校教学管理工作多年来积累的大量数据，本文对数据挖掘中的决策树算法-ID3算法进行了研究，并结合教育管理信息中数据的特点，对ID3算法进行了改进；根据改进算法设计了教育信息挖掘模DT-EIDM。决策树学习算法在数据挖掘技术中具有很重要的作用，本文首先研究了决策树学习算法中的ID3算法。此算法有以下三方面不足：(1)在决策树的每个节点上只选择单个属性，属性间的相关性强调不够，这一缺点导致决策树中子树的重复和有些属性在同一决策树上被多次选择。(2)在生成决策树过程中，由于递归地划分，一些数据子集可能变得太小，进一步划分它们就失去了统计意义。(3)倾向于有许多值的属性。本文针对ID3算法的不足，结合教育管理信息中数据的特点对ID3算法进行了改进，设计、实现了EIDT-DM算法，新算法主要做了以下改进：(1)大学四年要进行许多门课程的考试，对课程成绩挖掘结果所做的贡献也是不同的，如果考虑所有课程，挖掘涉及的属性就会很多，时间上就会浪费。本文在EIDT-DM算法中引入相关度概念，先对进行挖掘的非分类属性进行相关性分析，将与分类属性相关度小于事先规定的阈值的属性剔除。这减少了子树的重复，有效的降低了决策树的复杂度，从而使生成的知识更容易理解。(2)在生成决策树过程中，由于反复划分，一些数据子集可能变得太小，使得进一步划分失去了统计意义，为了避免这一问题，算法根据预先设定的分类阈值进行判断，如果给定子集中的样本数少于该阈值，该子集的进一步划分停止。作为替换，创建一个叶节点。在树剪枝时，对作为替换创建的叶节点，找出子集中分类属性具有最大样本数的类别，做为该叶节点的分类属性的值。例如子集中，分类属性=YES的样本个数大于分类属性=NO的样本个数，则该叶节点代表：分类属性=YES。(3)引进了复合度量基准取代信息增益作为决策属性选择的标准。在一定程度上解决了决策树采用信息增益基准所造成的偏向有许多值的属性的缺陷，并可改善决策树结构和分类正确率。然后，根据改进的EIDT-DM算法，设计了面向教育管理决策的数据挖掘模型：教育信息挖掘模型(DT-EIDM)，在挖掘模型DT-EIDM的实现过程中，运用支持多平台的JAVA开发语言，采用Oracle9i数据库创建了教育信息挖掘库，将不同数据源中所需要的挖掘数据进行集成和清理，导入到教育信息挖掘库中。根据教育信息挖掘库中的数据，可以对学生课程成绩信息，学生基本信息，以及包括学生学习成绩和基本信息的综合分类信息进行挖掘。在知识的表达和解释机制方面，使知识的表达不仅限于数字和符号，而且使用更容易理解的表格、图形等，并对获得的模式进行了简单的解释和评估。DT-EIDM挖掘模型以教育系统为背景，操作简单，可扩展性强。

著录项

作者
魏涛;
展开▼
作者单位

上海海事大学;

展开▼
授予单位上海海事大学;
学科计算机软件与理论
授予学位硕士
导师姓名周广声;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序设计、软件工程;高等教育;
关键词
数据挖掘; 决策树; ID3算法; 教育信息挖掘; 高等教育;

相似文献

中文文献
外文文献
专利

1. 基于社群挖掘及决策树模型的欺诈团伙检测 [J] . 于得水 . 商业观察 . 2021,第002期
2. 基于梯度提升迭代决策树模型的渔船转移数据挖掘 [J] . 李怡德 ,鲁峰 ,朱勇 . 农业大数据学报 . 2021,第003期
3. 基于数据挖掘的财务舞弊识别研究--决策树-神经网络组合模型的构建 [J] . 高媛媛 . 科技经济市场 . 2014,第011期
4. 基于决策树理论的数据挖掘模型 [J] . 沈建平 ,沈介文 ,陈琨 . 计算机与现代化 . 2004,第002期
5. 基于数据挖掘决策树的犯罪风险预测模型 [J] . 金光 ,钱家麒 ,钱江波 . 计算机工程 . 2003,第009期
6. 基于决策树的外科手术信息挖掘与研究 [C] . 罗林英 ,陈金雄 . 中华医院信息网络大会暨第四届中美医院信息化论坛 . 2008
7. 基于决策树技术的教育数据挖掘系统设计与实现 [A] . 许美玲 . 2017

基于决策树的教育信息挖掘模型（DT-EIDM）的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅