首页> 中文学位 >以概念分层为背景知识的关联规则挖掘算法的分析
【6h】

以概念分层为背景知识的关联规则挖掘算法的分析

代理获取

目录

文摘

英文文摘

独创性声明和关于论文使用授权的说明

引言

第一章数据挖掘概述

1.1数据挖掘的产生

1.2数据挖掘的定义

1.3数据挖掘的数据源

1.3.1关系数据库

1.3.2数据仓库

1.3.3事务数据库

1.3.4高级数据库系统和高级数据库应用

1.4数据挖掘的功能

1.4.1概念/类描述:特征化和区分

1.4.2关联分析

1.4.3分类和预测

1.4.4聚类分析

1.4.5孤立点分析

1.4.6演变分析

1.5数据挖掘的分类

第二章关联规则挖掘技术

2.1.关联规则挖掘的基本概念

2.2.频集搜索算法Algrithm-1

2.3.强关联规则的产生算法Algrithm-2

2.4.Apriori算法的效率改进方法

2.4.1.散列项集计数

2.4.2.事务压缩

2.4.3.划分

2.4.4.选样

2.4.5.动态项集计数

2.5.AprioriTid算法

2.6.关联规则挖掘的分类

2.7.基于约束的关联规则的挖掘

2.7.1.数据源过滤

2.7.2.频繁项集的过滤

2.8.冗余关联规则的检查

第三章多概念层关联规则挖掘方法的设计实现

3.1.概念分层(concept hierarchy)

3.2.挖掘多层关联规则的方法

3.3.同层(Same Hierarchy)关联规则挖掘

3.3.1.数据预处理

3.3.2.ML-SH算法

3.4.混合层(Mixed Hierarchies)关联规则挖掘

3.5.交叉层(Cross Hierarchies)关联规则挖掘

第四章多维关联规则挖掘方法的设计实现

4.1.使用量化属性的静态离散化挖掘多维关联规则

4.2.挖掘量化关联规则

4.2.1.量化关联规则挖掘算法

4.2.2.确定量化属性划分的聚类算法

4.2.3.量化关联规则的聚类

第五章总结

参考文献

致谢

展开▼

摘要

随着数据库技术的快速发展以及人们获取数据手段的多样化,我们所拥有的数据急剧增加,但对这些数据进行分析理解的工具却很少.数据库系统所能做到的只是对这些数据进行存取和简单的操作.大量数据背后隐藏着对决策十分有用的信息,例如数据的整体特征、数据所表现出来的发展趋势等,但从海量的数据中获取这些信息却不是一件容易的事.数据挖掘就是从大量的、不完全的、有噪声的数据中提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程.关联分析是数据挖掘的先行者,并且与其他学科的交叉内容较少.Apriori算法是关联分析的基础,量化关联规则挖掘所关心的问题是将连续数值的关联分析转换为布尔值,多维关联规则分析与约束性的关联分析都是解决实用问题的算法.数据挖掘中应用的方法包括传统的统计分析、分类、估计、预测和相关分析、关联规则、聚集,也包括最新发展起来的一些诸如数据可视化、决策树和神经网络等一些较新的方法.本文首先简要介绍了数据挖掘的产生、功能、分类和可供挖掘的数据源,然后详细分析了关联规则挖掘过程中最常用的频集发现算法Apriori,指出了该算法的不足之处.在此基础上,提出了一种以概念层作为背景知识的多层关联规则挖掘的方法,包括在同一概念层、混合概念层以及交叉概念层上进行关联规则挖掘的方法;同时,文中还给出了从单个属性具有背景知识的情况向多个属性都具有背景知识的情况进行扩展的方法,形成了多维关联规则挖掘的方法,从而克服了原有算法的缺点,极大的提高了算法的适用范围和功能.最后对未来的工作提出了展望.

著录项

  • 作者

    朱冀;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 邱会中;
  • 年度 2004
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    关联规则; 概念分层; 频繁项集;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号