首页> 中文学位 >基于数据仓库的学生成绩分析与研究
【6h】

基于数据仓库的学生成绩分析与研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 课题背景和研究意义

1.2 国内外研究现状

1.3 研究目的及研究内容

1.3.1 研究目的

1.3.2 研究内容

1.4 论文组织结构

2 数据仓库相关理论研究

2.1 数据仓库

2.1.1 数据仓库的概念

2.1.2 数据仓库的特点

2.1.3 数据仓库的体系结构

2.1.4 数据的ETL

2.2 OLAP技术

2.2.1 OLAP的定义

2.2.2 OLAP的特征

2.2.3 OLAP的多维数据结构

2.3 数据挖掘

2.3.1 数据挖掘的概念

2.3.2 数据挖掘的过程

2.3.3 数据挖掘方法

2.4 本章小结

3 学生成绩数据仓库的设计

3.1 主题定义

3.2 数据仓库三级模型的建立

3.2.1 概念模型设计

3.2.2 逻辑模型设计

3.2.3 物理模型设计

3.3 数据的ETL

3.3.1 数据抽取

3.3.2 数据清洗和转换

3.3.3 数据加载

3.4 建立多维数据集

3.5 多维数据集的操作与实现

3.6 基于数据仓库的学生成绩数据的分析

3.7 本章小结

4 基于数据仓库的决策树算法成绩分析

4.1 决策树算法研究

4.1.1 分类

4.1.2 决策树算法

4.1.3 决策树的简化

4.2 实验环境及数据准备

4.2.1 实验环境

4.2.2 数据准备

4.3 基于ID3算法的决策树模型

4.3.1 建立决策树模型

4.3.2 实现过程分析

4.3.3 生成分类规则

4.4 基于C4.5算法的决策树模型

4.4.1 建立决策树模型

4.4.2 实现过程分析

4.4.3 生成分类规则

4.5 实验结果分析及结论

4.6 本章小结

5 基于数据仓库的关联规则方法成绩分析

5.1 关联规则算法研究

5.1.1 关联规则

5.1.2 Apdori算法

5.2 问题提出与数据准备

5.3 关联规则挖掘模型

5.4 实验过程及结果分析

5.5 本章小结

6 总结与展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

随着我校研究生院信息化建设工作的开展,研究生综合教务系统已投入使用。但是目前系统中只实现了基本的数据查询和数据备份的功能,分析功能还比较弱,系统中积累了大量学生的数据得不到充分的利用。在这些数据中学生成绩是衡量学生综合素质的一个重要指标,同时也是评估教学质量的一个重要指标,而教学质量的好坏直接反映出学校的综合实力。因此学校的决策人员也更加关心学生成绩的分布情况以及学生成绩的影响因素等信息,从而采取相应的办法来提高教学质量。
  因此本文将学生成绩作为分析与研究的对象,首先建立了学生成绩数据仓库。数据仓库的建立过程包括建立三级数据模型以及多维数据集的建立,之后通过EXCEL透视表服务展现了学生成绩的分布情况并得出一些结论。同时为了进行更加深入的研究,引入了决策树分析方法和关联规则分析方法。在确定数据集之后,分别建立了基于ID3算法和C4.5算法的决策树模型,分析学生的基本信息情况对学生成绩的影响,之后使用测试集数据对两种算法的准确率、召回率、F值进行验证并对比了两种算法的实验结果,发现C4.5算法相比于ID3算法准确率更高,而且C4.5算法在决策树的构造过程中就进行剪枝,使创建的决策树叶子结点的个数相对少些,结构也更紧凑些;并且生成的规则更简洁、也更容易被理解,更能满足决策人员的需要。因此根据C4.5算法建立的决策树得出了适用于招生决策的一些结论。
  在本校学生的培养方案中,学生学习的课程,是按照公共课、基础理论课、专业基础课的先后顺序进行安排。其中,公共课是基础理论课的基础,基础理论课是专业基础课的基础;前期开设的专业课的学习效果对与之有关联的后期开设的专业课的学习也有很大的影响。因此本文实现了关联规则分析的经典算法一Apriori算法,找出学生公共课、专业基础课、基础理论课成绩之间的关系,并得出一些预测性的结论,同时也为研究生招生工作提供决策支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号