首页> 中文学位 >基于多级置信度阈值的正负关联规则挖掘研究
【6h】

基于多级置信度阈值的正负关联规则挖掘研究

代理获取

目录

第一个书签之前

展开▼

摘要

关联规则挖掘是数据挖掘领域中一个重要的研究方向。它揭示了数据集中项集之间的有趣关联关系,具有重要的理论价值和广泛的应用前景。然而,大多数的关联规则挖掘仅研究了数据项集之间的正向关联关系,对于隐藏在数据集中的项集间的负向关联关系,没有引起足够的重视。但是,在实际应用中,项集间的负向关联关系能为决策者提供更多有价值的决策信息。因此,正负关联规则挖掘的研究具有重要的现实意义。 本文对正负关联规则挖掘的基本理论进行了讨论,深入地分析了有效正负关联规则挖掘算法设计的关键要素,总结了现有挖掘算法的不足。现有的基于多级置信度阈值的正负关联规则挖掘算法难以有效地设置多个置信度阈值来控制无趣规则的数量,提取出可信度高的规则。并且它们在挖掘过程中还容易遗漏一些有趣的关联规则。对此,本文对基于多级置信度阈值的正负关联规则挖掘算法进行了深入的分析和研究,取得如下研究成果: (1) 结合项集相关性,系统地分析了正负关联规则置信度随规则的项集支持度大小变化的特点。据此特点提出了一种新的正负关联规则两级置信度阈值设置方法TCTPN。理论分析和实验对比结果表明,新方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显著降低可信度低的关联规则数量。 (2) 提出了一个基于相关性度量Kulc和 TCTPN的正负关联规则挖掘算法PNARKT。算法基于有趣正负关联规则前件和后件的正项集频繁的理论,通过对事务数据库中不相交的两个频繁项集进行相关性分析来产生强正负关联规则,从而减少了有趣规则的遗漏。同时,相关性度量Kulc和新置信度阈值设置方法TCTPN的结合可以保证PNARKT算法提取出的规则有趣、可信。理论证明和实验对比结果都表明,PNARKT算法不仅可以更好地避免有趣正负关联规则的遗漏,而且在零事务居多以及两个项集蕴含关系具有不平衡特点的事务数据库中,也能有效地提取出有趣的正负关联规则。

著录项

  • 作者

    陈柳;

  • 作者单位

    四川师范大学;

  • 授予单位 四川师范大学;
  • 学科 基础数学
  • 授予学位 硕士
  • 导师姓名 冯山;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 计算技术、计算机技术;
  • 关键词

    多级; 置信度阈值;

  • 入库时间 2022-08-17 11:18:00

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号