首页> 中文学位 >“中国教育经济信息网”建设中数据挖掘技术的研究与应用
【6h】

“中国教育经济信息网”建设中数据挖掘技术的研究与应用

代理获取

目录

文摘

英文文摘

声明及关于论文使用授权的说明

第一章绪论

1.1课题的研究背景

1.2数据挖掘技术在CEE系统应用的必然性

1.3作者完成的主要工作

1.4本文的主要工作

1.5论文组织结构

第二章中国教育经济信息网(CEE)

2.1中国教育经济信息网概述

2.2 CEE系统功能设计

2.3 CEE系统运行环境

2.3.1软件环境

2.3.2硬件环境

2.4 CEE应用系统结构

第三章数据挖掘概述

3.1数据挖掘的出现

3.2数据挖掘的概念

3.2.1数据挖掘的定义

3.2.2与传统分析方法的区别

3.3数据挖掘任务和功能

3.3.1数据挖掘所能够挖掘的知识类型

3.3.2数据挖掘的功能

3.4数据挖掘的步骤

3.5数据挖掘系统总体结构

3.6数据挖掘的研究需求

3.7数据挖掘的分类

3.8数据挖掘的研究现状

第四章数据挖掘系统CEEDM

4.1 CEEDM系统体系结构

4.2目前系统所完成的主要功能

4.3系统的工作流程

第五章CEEDM系统数据预处理

5.1数据预处理概述

5.2数据集成

5.3数据缩减

5.3.1特征选取

5.3.2样本数据选取

5.4数据清理

5.4.1缺失数据处理

5.4.2噪音数据处理

5.5数据转换

5.6数据离散化

第六章CEEDM系统数据预分析

6.1数据预分析概述

6.2数据描述

6.3数据运算

6.4统计分析

6.5回归分析

第七章CEEDM系统关联规则挖掘

7.1关联规则挖掘的基本知识

7.1.1基本概念与问题的描述

7.1.2关联规则的种类

7.2关联规则挖掘经典的频集算法

7.2.1 Apriori算法的主要思想

7.2.2生成高频项目集的算法

7.2.3生成长度为k的候选项目集的算法

7.2.4根据高频项目集生成关联规则的算法

7.2.5 Apriori算法的改进方案

7.3 CEEDM系统中采用的频集挖掘方法

7.4分析结果的解释和评价

7.5多层和多维关联规则的挖掘

结束语

参考文献

致谢

展开▼

摘要

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多.激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据.如果不借助强有力的挖掘工具,仅依靠人的能力来理解这些数据是不可能的.虽然目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势.数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的.数据挖掘从大量数据中提取出隐藏在数据之后的有用的信息,它被越来越多的领域所采用,并取得了较好的效果,为人们的正确决策提供了很大的帮助.该文主要内容是对数据挖掘技术在中国教育经济信息网(CEE)中应用的研究,并在此基础上设计和开发了数据挖掘系统CEE Data Miner,简称CEEDM.该文结合数据挖掘系统CEEDM的设计与系统中作者负责实现的关联规则挖掘技术部分,对数据挖掘技术中的一些重要的概念、方法和策略进行研究,集中讨论了关联规则挖掘技术在CEEDM系统中的应用与实现,并针对Apriori算法的固有缺陷,对不产生候选挖掘频繁项集方法--FP-growth频集算法进行分析并加以实现.该文的主要贡献主要体现在以下几个方面:●成功的实现了数据挖掘技术在中国教育经济信息网(CEE)中的应用.●完成了对数据挖掘系统CEEDM的总体设计.●针对Apriori算法的固有缺陷,对不产生候选挖掘频繁项集方法--FP-growth频集算法进行分析并加以实现.

著录项

  • 作者

    刘光辉;

  • 作者单位

    西安建筑科技大学;

  • 授予单位 西安建筑科技大学;
  • 学科 计算机应用
  • 授予学位 硕士
  • 导师姓名 董丽丽;
  • 年度 2004
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;TP393.18;
  • 关键词

    数据挖掘; 关联规则; 频繁项集; FP-growth算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号