首页> 中国专利> 一种基于独立概率完全加权的并行关联规则挖掘方法

一种基于独立概率完全加权的并行关联规则挖掘方法

摘要

本发明提出了一种基于独立概率完全加权的并行关联规则挖掘方法。该方法采用Spark运行框架,通过对项集进行依赖数据集的独立概率计算从而获得该项集权值的方法,对数据集进行加权关联规则挖掘。首先通过用户给定的数据集地址读取数据集并转换成垂直数据形式,对转换后的垂直数据库进行读取后计算项的独立概率权值,并过滤得到加权频繁1‑项集。对加权频繁1‑项集求交集,计算候选2‑项集的平均权值后过滤出加权频繁2‑项集。迭代地对加权频繁(K‑1)‑项集使用前缀划分方法得到加权频繁K‑项集。以上整个过程均使用位图结构对加权频繁项集的TidSet进行存储以加快求交集速度。数据预处理及前缀划分原则使本发明运行效率更快,独立概率完全加权的方法可以使本发明发掘出更多隐藏在事务集中的知识及规则。

著录项

  • 公开/公告号CN114185970A

    专利类型发明专利

  • 公开/公告日2022-03-15

    原文格式PDF

  • 申请/专利权人 哈尔滨理工大学;

    申请/专利号CN202111515043.X

  • 发明设计人 李成严;李鑫宇;张磊;

    申请日2021-12-13

  • 分类号G06F16/2458(20190101);G06F16/22(20190101);G06F16/33(20190101);

  • 代理机构

  • 代理人

  • 地址 150080 黑龙江省哈尔滨市南岗区学府路52号

  • 入库时间 2023-06-19 14:31:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号