首页> 中文学位 >改进的Apriori算法及其在领域数据挖掘中的应用
【6h】

改进的Apriori算法及其在领域数据挖掘中的应用

代理获取

摘要

随着计算机的普及应用和计算机网络的飞速发展,在过去若干年里,无论是商业企业、科研机构或者政府部门,各个领域都积累了海量的并以不同形式存储的数据。面对如此多的数据,人们不再满足于日常的事务处理,而是更加关注能否从形式不同的,分散的,纷繁复杂的数据环境中得到有用的决策信息,从而可以做出正确的分析和决策。数据仓库和数据挖掘技术的产生为这个领域数据难题提供了一个很好的解决方案。
   数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员决策的系统,它可以把领域内以不同形式存储的海量数据集成在一起供分析人员进行分析。数据挖掘是一个从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,数据挖掘技术为领域数据分析人员提供数据分析的方法。本文首先对数据仓库和数据挖掘技术进行了研究,提出领域数据仓库构建的三层模型结构和领域数据挖掘系统开发方法。进而重点研究了关联规则挖掘算法,通过深入研究Apriori算法及其一些现有改进算法,针对Apriori算法的不足提出四点改进,设计完成了基于项集重排序的Apriori_Sort算法。
   为了验证改进后算法的有效性,本文做了大量的实验,实验证明,改进后的算法由于大大减少了候选项集的数量从而提高了算法的效率。将Apriori_Sort算法应用到能源领域的数据挖掘系统中,对多维能源数据进行了关联规则挖掘,通过对关联规则分析得到一些能源领域内一些节能方案。最后,对领域数据挖掘的进一步发展和能源数据挖掘的进一步完善做出了展望。

著录项

  • 作者

    王芳;

  • 作者单位

    河北工业大学;

  • 授予单位 河北工业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 顾军华;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    领域数据挖掘; 数据仓库; 关联规则;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号