首页> 中国专利> 一种基于独立概率完全加权的并行关联规则挖掘方法

一种基于独立概率完全加权的并行关联规则挖掘方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出了一种基于独立概率完全加权的并行关联规则挖掘方法。该方法采用Spark运行框架，通过对项集进行依赖数据集的独立概率计算从而获得该项集权值的方法，对数据集进行加权关联规则挖掘。首先通过用户给定的数据集地址读取数据集并转换成垂直数据形式，对转换后的垂直数据库进行读取后计算项的独立概率权值，并过滤得到加权频繁1‑项集。对加权频繁1‑项集求交集，计算候选2‑项集的平均权值后过滤出加权频繁2‑项集。迭代地对加权频繁(K‑1)‑项集使用前缀划分方法得到加权频繁K‑项集。以上整个过程均使用位图结构对加权频繁项集的TidSet进行存储以加快求交集速度。数据预处理及前缀划分原则使本发明运行效率更快，独立概率完全加权的方法可以使本发明发掘出更多隐藏在事务集中的知识及规则。

著录项

公开/公告号CN114185970A

专利类型发明专利
公开/公告日2022-03-15

原文格式PDF
申请/专利权人哈尔滨理工大学;
展开▼

申请/专利号CN202111515043.X
发明设计人李成严;李鑫宇;张磊;
展开▼

申请日2021-12-13
分类号G06F16/2458(20190101);G06F16/22(20190101);G06F16/33(20190101);
代理机构
代理人
地址 150080 黑龙江省哈尔滨市南岗区学府路52号
入库时间 2023-06-19 14:31:20

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-15

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 用于发现文本词间关联规则的完全加权模式挖掘方法 [P] . 中国专利： CN103838854B . 2017.03.22
2. 用于发现文本词间关联规则的完全加权模式挖掘方法 [P] . 中国专利： CN103838854A . 2014-06-04
3. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16
4. 一种基于动态视觉传感器的角点检测方法 [P] . 世界知识产权组织专利： WO2020/143499A1 . 2020.07.16
5. 一种基于集成学习的工业控制系统入侵检测方法 [P] . 世界知识产权组织专利： WO2020/143226A1 . 2020.07.16