基于模糊集的数量型关联规则算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在信息爆炸的时代，信息过量已经成为大家面对的一个新的问题。人们迫切需要一些新的强有力的数据分析方法及工具来自动化、智能化地将海量的数据转化为有用的信息和知识。数据挖掘正是这样一种技术。其中，关联规则发现是数据挖掘中最重要的任务之一，它的目标是发现数据集中所有的频繁模式和强关联规则。目前，对于布尔型属性关联规则挖掘的研究相对比较成熟，但是对于数量型属性关联规则挖掘问题还需要进行广泛地研究。解决数量型关联规则挖掘问题的一个非常重要的方法就是将其转换为布尔型关联规则挖掘的问题。对于数量型属性当属性全部取值是有限个数时，只需将每个属性值映射为一个布尔型属性即可，当属性的取值范围很宽时，则需将其划分成为若干个区间，然后将每个区间映射为一个布尔型属性。然而在划分区间时往往容易出现一些问题，例如：若区间划分过小，即区间的划分个数过多时，会造成每一个单个区间的支持度都很低；将值划分成区间时，可能会造成一些信息丢失；在处理高偏度的数据时，连续属性离散化很难有效地体现出数据的实际分布情况；存在划分边界过硬的弱点等等。因此，对数量型关联规则挖掘算法的研究就转化为如何对数量型属性定义域的合理划分问题。虽然已经有人提出使用模糊集理论来解决这些问题，但是对于算法的具体实现的研究仍值得不断探索和深入。本文先阐述了有关数据挖掘的一些主要技术以及与关联规则相关的问题，接着讨论了模糊集合、模糊相似矩阵、模糊等价矩阵等模糊集理论的原理及特性，以基于模糊等价矩阵的模糊聚类方法为基础提出了分类数不确定的FEM-TC算法，描述了该算法实现的一般步骤；通过典型数据直接观察法对算法的正确性与有效性进行了验证；在确定了F统计量作为评判分类效果优劣的标准之后又对其中的关键步骤，即数据规格化和构造模糊相似矩阵，各自采用不同方法的分类结果进行了多方面的对比分析，确定了最佳的模型。然后，以基于目标函数的模糊ISODATA聚类方法为基础提出了分类数确定的FMI算法以及检验该算法分类效果的指标，描述了算法的具体实现，同样也使用一些典型的数据对FMI算法的正确性及有效性进行了验证与分析，明确了初始模糊划分矩阵的一些特点。在研究了对数量型属性进行分类或者区间划分的两种算法之后，本文又对经典的Apriori算法进行剖析，并在如何发现频繁项集和生成关联规则等方面对经典的Apriori算法进行了改进，即利用去尾法求子集再交叉关联，只需一次扫描数据库即可得到满足要求的关联规则。之后，本文又探讨了在计算支持度和置信度时如何合理使用模糊分类过程中产生的隶属度的值，提出了一些新的基于模糊隶属度的支持度与置信度的计算方法。最后，对某地区源头式煤税监控系统中的数据进行了挖掘分析应用，在一定程度上再次验证了本文所提出的几个算法的有效性和可用性，并展望了以后的研究方向。

著录项

作者
赵磊;
展开▼
作者单位

西南大学;

展开▼
授予单位西南大学;
学科农业机械化工程
授予学位硕士
导师姓名余建桥;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
隶属度; 模糊等价矩阵; 数量型属性; 关联规则;

相似文献

中文文献
外文文献
专利

1. 基于数量型数据挖掘的模糊概念关联规则 [J] . 张艳 . 计算机时代 . 2009,第010期
2. 基于梯形云的数量型关联规则挖掘方法 [J] . 王兆红 . 信息技术与信息化 . 2005,第006期
3. 基于公理化模糊集语义图像层次关联规则分类器 [J] . 韦容 ,申希兵 ,杨毅 . 计算机工程与应用 . 2016,第020期
4. 基于模糊集的时序关联规则研究与应用 [J] . 闫雨石 . 电子技术与软件工程 . 2015,第014期
5. 基于模糊集的时序关联规则的度量准则 [J] . 宋中山 ,杨敏 ,周易 . 中南民族大学学报（自然科学版） . 2014,第001期
6. 一种新的数量型关联规则挖掘方法 [C] . . 全国第19届计算机技术与应用学术会议(CACIS·2008) . 2008
7. 基于梯形云模型的数量型关联规则挖掘方法 [A] . 王兆红 . 2004

基于模糊集的数量型关联规则算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅