首页> 中文学位 >基于多最小支持度的关联规则挖掘研究
【6h】

基于多最小支持度的关联规则挖掘研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景和意义

1.1.1 课题来源

1.1.2 研究的目的意义

1.2 国内外研究现状及水平

1.3 本文主要结构

第2章 不完备信息系统的基础理论

2.1 粗糙集理论的相关概念

2.1.1 信息系统

2.1.2 决策表

2.2 不完备信息系统完备化

2.2.1 Mean Completer算法

2.2.2 Combinatorial Completer算法

2.3 信息系统的属性约简

第3章 挖掘关联规则基本介绍

3.1 关联规则的基本介绍与定义

3.2 单维关联规则的挖掘算法介绍

3.2.1 挖掘频繁项集

3.2.2 关联规则的产生

3.3 多层关联规则

3.3.1 多层数据

3.3.2 多层关联规则的挖掘

3.4 模式评估

3.4.1 规则是否有趣的判定

3.4.2 相关度分析

第4章 Apriori算法及其改进算法

4.1 Apriori算法

4.1.1 Apriori算法简介

4.1.2 Apriori算法实例

4.2 基于黄金比例的关联规则挖掘算法

4.2.1 改良算法的基本概念

4.2.2 改良算法的核心思想

4.2.3 改良算法的步骤与流程

4.3 改良算法仿真实验

4.3.1 改良算法实例

4.3.2 改良算法效率分析

第5章 不完备信息系统中关联规则的挖掘

5.1 不完备信息系统中未知信息的处理

5.1.1 组合算法中完备化理论简介

5.1.2 组合算法的基础定义与性质

5.1.3 组合算法中的属性约简

5.2 不完备信息系统关联规则挖掘综述

5.2.1 不完备信息系统数据预处理总结

5.2.2 不完备信息系统关联规则挖掘步骤与流程

5.3 不完备信息系统中关联规则的挖掘实例分析

5.3.1 决策表完备化

5.3.2 决策表属性约简

5.4 预处理后的决策表关联规则的挖掘

5.5 仿真实验

第6章 总结与展望

6.1 研究总结

6.2 未来展望

参考文献

攻读硕士学位期间发表的论文及科研工作

致谢

展开▼

摘要

随着社会的发展和进步,数据库中的数据量越来越大。如何从海量的数据中找到自己所需要的规则已经成为了人们不得不面对的问题。在大量的数据里挖掘所需要的规则是非常繁琐的,一方面由于在现实社会中,得到的数据往往是缺失部分值的,这对于规则的挖掘非常不利,另一方面,数据库中的条件属性有些对于决策的得出是不必要的,不需要进行考虑的,多余属性的存在一定程度上使规则的挖掘更加麻烦。同时,目前针对关联规则的挖掘大部分使用的是单最小支持度,这不利于实际的应用。针对上述存在的问题,本文将粗糙集理论中的不完备信息系统完备化、属性约简与关联规则挖掘相结合,进行了基于多最小支持度的关联规则挖掘研究。主要研究内容如下:
  1.简单介绍了粗糙集与关联规则的相关理论,以及关联规则挖掘问题的国内外研究现状,并对其进行了相应研究。
  2.在原Apriori算法的基础上结合黄金比例进行改进,得出基于黄金比例的关联规则挖掘算法。改进算法解决了最小支持度过于单一的问题,通过仿真实验证明该算法可以有效提高挖掘关联规则的效率。
  3.针对不完备信息系统中关联规则的挖掘,本文对相关的传统算法进行了改进。首先,从不完备信息系统中对完备的数据进行抽样,设定较高的支持度阈值后,运用基于黄金比例的关联规则挖掘算法对抽样后的数据进行挖掘,得出其中的频繁项集。之后,借助频繁项集按照一定的规则对不完备数据进行完备化与属性约简,得到新的信息系统。最后,通过改良算法对新的信息系统进行挖掘,得出不完备信息系统中的关联规则。
  仿真实验分析表明,组合算法实际运行可行,且与其他算法相比,本文所提组合算法显著提高了在不完备信息系统中挖掘关联规则的效率。
  目前针对完备信息系统的关联规则挖掘已有较多的研究成果,但在不完备信息系统中的关联规则挖掘研究较少,同时本文通过挖掘关联规则来对不完备信息系统进行完备化与属性约简,为以后的研究提供了可能的方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号