首页> 中国专利> 基于Spark的并行化关联挖掘优化方法

基于Spark的并行化关联挖掘优化方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开一种基于Spark的并行化关联挖掘优化方法，先对事务数据库进行预处理，根据业务需求进行数据清洗，提取简要有效信息，将事务项数据编码化后，全部读取到内存，转换成RDD模型；在生成频繁1项集的过程中，构造新的数据结构存放1项集的事务序列号；在频繁项集连接、剪枝生成候选集的过程中，舍去候选项集的产生过程，筛选出连接后事务序列号数满足最小支持度的项集；重复以上过程，直到没有满足要求的更大的项集产生。本发明克服了Apriori算法的不足，提高了挖掘效率。

著录项

公开/公告号CN107291848A

专利类型发明专利
公开/公告日2017-10-24

原文格式PDF
申请/专利权人南京邮电大学;
展开▼

申请/专利号CN201710413035.1
发明设计人肖甫;许平;沙乐天;王少辉;韩崇;王汝传;
展开▼

申请日2017-06-05
分类号
代理机构南京知识律师事务所;
代理人张芳
地址 210023 江苏省南京市栖霞区亚东新城区文苑路9号
入库时间 2023-06-19 03:35:50

法律信息

法律状态公告日

法律状态信息

法律状态
2017-11-24

实质审查的生效 IPC(主分类):G06F17/30 申请日:20170605

实质审查的生效
2017-10-24

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于Spark的并行化关联挖掘优化方法 [P] . 中国专利： CN107291848A . 2017-10-24
2. 基于Spark和ASPSO的并行化K-means的优化方法 [P] . 中国专利： CN113128617A . 2021-07-16
3. SPARK ARCHITECTURE OPTIMIZATION METHOD BASED ON AN SSD AND HDD HYBRID STORAGE SYSTEM [P] . 世界知识产权组织专利： WO2018209692A1 . 2018-11-22

机译：基于SSD和HDD混合存储系统的SPARK结构优化方法。
4. METHOD FOR TRAFFIC FLOW PREDICTION BASED ON SPATIO-TEMPORAL CORRELATION MINING [P] . 美国专利： US2016314686A1 . 2016-10-27

机译：基于时空关联挖掘的交通流量预测方法
5. METHOD FOR DATA PLANE STATIC ANALYSIS BASED ON DATA DEPENDENCY FOR NETWORK SWITCH PARALLELIZATION AND PARALLELIZATION DEVICE USING SAME [P] . 韩国专利： KR20200061280A . 2020-06-02

机译：基于数据依赖度的网络开关并行化数据平面静态分析方法及并行化方法