首页> 中文学位 >数据挖掘技术在高校招生工作中的应用
【6h】

数据挖掘技术在高校招生工作中的应用

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1数据挖掘的历史及其发展

1.2目前数据挖掘研究现状

1.2.1 国外研究与应用现状

1.2.2国内研究与应用现状

1.3课题研究的背景及意义

1.4论文的研究内容

1.5论文组织结构

第2章数据挖掘技术

2.1数据挖掘定义

2.2数据挖掘与相关学科的区别与联系

2.2.1 数据挖掘与数据库报表工具的区别

2.2.2数据挖掘与传统数据分析工具的区别

2.2.3数据挖掘与机器学习的联系及区别

2.2.4数据挖掘与联机分析处理(OLAP)的区别

2.3数据挖掘的功能

2.3.1分类和预测

2.3.2关联分析

2.3.3聚类分析

2.3.4概念描述

2.3.5演变分析

2.3.6孤立点分析

2.4数据挖掘的过程

2.4.1定义挖掘问题

2.4.2数据准备

2.4.3数据挖掘

2.4.4模式评价和解释

2.5本章小结

第3章关联规则数据挖掘算法研究

3.1关联规则

3.2 Apriori算法

3.2.1 Apriori算法:使用候选项集找频繁项集

3.2.2 Apriori算法的缺陷

3.2.3 Apriori算法的几种优化方法

3.3 FP-growth算法

3.3.1 FP-tree算法

3.3.2 FP-growth算法实施

3.4本章小结

第4章聚类分析算法研究

4.1什么是聚类分析

4.2聚类分析的评价标准

4.3主要的聚类方法

4.3.1划分的方法(Partitioning Method)

4.3.2层次的方法(Hierarchical Method)

4.3.3基于密度(Density-Based)的方法

4.3.4基于网格(Grid-Based)的方法

4.3.5基于模型(Model-Based)的方法

4.3.6基于图论(Graph Theory)的方法

4.4本章小结

第5章探索数据挖掘技术在高校招生工作中的应用

5.1应用描述

5.2相关数据处理

数据采集

5.2.2数据预处理

5.3关联规则在招生信息分析中的应用

5.3.1针对关联规则挖掘需要对原始数据库进行处理

5.3.2编程策略

5.3.3输出规则

5.3.4结果分析

5.4聚类分析在毕业生信息信息分类中的应用

5.4.1数据源

5.4.2针对聚类分析的数据转换

5.4.3聚类算法实现的思路

5.4.4计算条件信息熵和互信息值

5.4.5结果分析

5.5本章小结

结论

参考文献

攻读硕士学位期间所发表的学术论文

致谢

展开▼

摘要

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的知识,从而挖掘出其潜在的价值,提高其利用率,是信息处理技术研究领域的一项重要课题。作为其解决方案,近年来数据挖掘(DataMining, DM)技术迅速崛起。 数据挖掘是目前信息领域和数据库技术的前沿研究课题,被公认为最具发展前景的关键技术之一。数据挖掘涉及到数理统计、模糊理论、神经网络和人工智能等多种技术,技术含量比较高,实现难度也较大。 本文以数据挖掘技术的研究作为核心,深入研究了关联规则和聚类分析技术。关联规则及聚类分析作为数据挖掘的两个重要方法,有着可理解性强、简洁性好、应用范围广等优点。本文探讨了这两种挖掘算法实现中的各项技术,以及它们在现实系统中的应用。 在任何一所高校中,往往都积累有大量学生的入学信息、毕业生信息和在校期间的成绩等资料。如果能对这些数据进行关联规则和聚类分析的挖掘,寻找出考生的各种因素与学生在校期间成绩以及毕业信息之间的关联关系,研究考生生源特征与培养之间的关系,进而能指导学校的招生和就业等工作。 本文以北京第二外国语学院的学生数据为背景,通过大量的数据预处理工作,应用关联规则的FP-growth算法及基于图论的METIS聚类算法对上述数据进行了数据挖掘,最终挖掘到有一定价值的信息。 本文所做的工作主要如下: 1、论述了数据挖掘的基本理论、相关技术: 2、讨论了关联规则的Apriori算法及其改进算法FP-tree及FP-growth算法; 3、讨论了聚类分析的几类方法; 4、在高校学生数据库中实现了关联规则挖掘及聚类分析。具体工作包括:应用实例的分析、从原始数据收集到数据的预处理的实现、以及关系数据库到适合挖掘的数据转换;实现了利用FP-tree及FP-growth算法寻找频繁项集、输出挖掘到的关联规则;实现了应用聚类分析的基于图论的方法对学生数据进行聚类,输出聚类的结果。 5、利用粗糙集中条件信息熵和互信息值的理论,提出对聚类结果和所有的特征进行计算,寻找出在所有的特征集中,哪些特征对聚类的贡献最大的方法,即寻找哪些特征会是最能将学生分类的特征。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号