频繁项目集
频繁项目集的相关文献在1998年到2022年内共计218篇,主要集中在自动化技术、计算机技术、数学、贸易经济
等领域,其中期刊论文207篇、会议论文8篇、专利文献69642篇;相关期刊105种,包括电脑知识与技术、福建电脑、计算机工程等;
相关会议7种,包括第二十一届中国数据库学术会议、第二十届全国数据库学术会议、2003年全国理论计算机科学学术年会等;频繁项目集的相关文献由355位作者贡献,包括朱玉全、吉根林、孙志挥等。
频繁项目集—发文量
专利文献>
论文:69642篇
占比:99.69%
总计:69857篇
频繁项目集
-研究学者
- 朱玉全
- 吉根林
- 孙志挥
- 宋余庆
- 杨君锐
- 卢炎生
- 杨鹤标
- 任永功
- 周海岩
- 徐凤生
- 杨明
- 王利钢
- 胡学钢
- 赵栋
- 陈平
- 陈耿
- 付玉
- 冯剑琳
- 宋顺林
- 张亮
- 李曲
- 罗可
- 赵斌
- 郭有强
- 马丽生
- 黄勇
- 付长贺
- 何宏
- 刘万春
- 刘丽
- 刘兴丽
- 刘凡
- 刘希玉
- 刘晓玲
- 吕坦悦
- 娄兰芳
- 宋海声
- 富志伟
- 张伟
- 张佩江
- 张蕾
- 敬会
- 朱玉文
- 李健宏
- 杨泽民
- 杨秋叶
- 杨萍
- 林倩瑜
- 林和平
- 林松
-
-
耿飙;
梁成全
-
-
摘要:
为了从大型数据集中找到数据不同属性之间的关系,对糖尿病数据集通过FP-Growth算法及其变体提取关联规则,即CFP-Growth和ICFP-Growth。通过实验,三种算法FP-Growth、CFP-Growth和ICFP-Growth的准确率分别为51.30%,57%和60.5%。结果表明ICFP-Growth比CFP-Growth和FP-Growth更准确。
-
-
周永强;
杨振华
-
-
摘要:
为了探索天气与地铁客流量之间的关系,为地铁运营部门科学合理的调度、预案的制定提供帮助,对地铁大数据进行了关联规则挖掘,并对经典的关联规则算法Apriori进行了改进.改进算法提高了从海量数据中取得频繁项目集的效率,降低了对计算机资源的消耗,高效地挖掘出了天气因素对地铁客流影响的规律.
-
-
陈平;
王利钢
-
-
摘要:
带约束的关联规则挖据算法(ACARMT)在生成频繁项集时反复比较事务标识符,耗时较多。为进一步提高挖掘的效率,文章提出了一种项约束频繁项集挖掘算法(CFMABTB)。该算法首先根据约束条件C过滤原始数据库,再为每一个项目建立事务二进制,然后通过反复与运算计算各项目集的计数,进而挖掘出k项频繁集。最后在mushroom、chess数据集上,对CFMABTB、ACARMT算法进行了实验对比。结果表明,在数据规模和项目数量不是非常大时,CFMABTB算法的时间性能远优于ACARMT算法。
-
-
-
陈婷婷;
龙士工
-
-
摘要:
针对频繁项目集挖掘结果直接发布可能会造成严重的个人隐私泄露,提出一种满足差分隐私的频繁项目集挖掘算法.为降低差分隐私的全局敏感度,根据候选项的覆盖分数和项集与事务距离两个指标,采用启发式截断算法进行事务截断,尽可能多地使截断后的事务保留原事务的频繁项信息.采用最大支持度估计策略生成候选项集,降低因事务截断和剪枝操作带来的误差.实验结果对比分析表明,提出算法满足差分隐私保护,挖掘的频繁项集具有较好的效用.
-
-
付泽强;
王晓锋;
孔军
-
-
摘要:
在网络安全防御体系中,入侵检测系统会实时产生海量冗余、错误的网络安全告警信息,因此有必要对告警信息的关联规则和序列模式进行频繁项模式挖掘,分辨正常的行为模式,筛选出真正的攻击信息.相对于Apriori和FP-growth等算法,COFI-tree算法虽然具有较大的性能优势,但仍无法满足大规模网络安全信息快速分析的需求.为此,基于COFI-tree算法,提出了一种改进的网络安全告警信息关联分析算法.该算法通过基于倒序链表的头表节点寻址方式和基于新的SD结构的频繁项处理方法,提升了COFI-tree算法的性能.基于Kddcup99数据集的实验结果表明,与传统的Cofi算法相比,该方法在基本保证准确率的同时,能大量降低计算开销,使处理时间平均缩短21%以上,解决了在海量网络告警信息下进行关联分析时速率不高的问题.
-
-
-
齐艳;
段俊钏
-
-
摘要:
数据挖掘(DM)和联机分析处理(OLAP)是支持企业决策的有效办法.从关联规则挖掘的特点考虑,结合Apriori算法的不足之处,提出改进的频繁项目集RT_Apr算法.引入新的存储单元Tid_unit,大大减少了遍历数据库次数,有效地降低了算法的时间复杂度,构建OLAP与关联规则挖掘集成模型,并在此基础上设计并实现了关联规则挖掘系统,节约了挖掘时间和提高了系统效率.
-
-
郭茹
-
-
摘要:
本文的选题源于国内外学者有关Apriori算法改进的重要理论及实证研究成果,针对Apriori改进算法中存在的运行时间长,占用内存大及时间复杂度高等问题,基于对国内外的研究成果和客观分析,设计出一种全新思维的双向搜索Apriori改进算法.最后通过与其中一种Apriori改进算法运行结果进行比较,双向搜索的Apriori改进算法运行速度约提高了8倍,占用内存节约了7MB,时间复杂度也相应减少.
-
-
张永梅;
许静;
郭莎
-
-
摘要:
The existing association rule mining algorithms or methods waste most of their time on the correlation set database scanning,the frequent scanning and the generating of redundant frequent itemsets candidates during their rule acquisition computation. The traditional methods can get more comprehensive mining results,but not all of the rules that came from the mining result are important. Traditional methods don’ t reflect the importance of association rules so as to have inefficiency for mining results,and they are not conducive to the gaining of main target results. Aimed at the mining of important goal,an improved Apriori algorithm based on linked list structure and heap sort is proposed. The algorithm scans the whole database to get the frequency of the appearance of each item set among the whole datasets and do the heap sort. Then,according to the established heap,all the k rank candidate sets are obtained and the relative support is calculated. The support degree of different project sets is compared with the minimum support degree. If the minimum support is met,the corresponding frequent item set should be added to the list,or it should be cut according to the shear or pruning strategy. By connecting operation,the candidate k+1 order item set can be obtained from the generated k order frequent item sets,so to generate the k+1 order fre-quent item sets. In this way,the generation of frequent itemsets can be greatly improved,and the mining results of important association rules can be provided,which can improve the speed of operation.%现有的关联规则数据挖掘算法或方法中,获取规则的计算时间很大一部分都耗费在关联项目集的扫描、数据库频繁扫描和生成冗余候选频繁项目集中。传统方法虽然得到的挖掘结果比较全面,但并不是所有挖掘结果中的规则都是重要的,以往的方法没有反映出重要的关联规则而使得挖掘结果的有效性不高,不利于得到需要的重要目标结果。针对重要目标的挖掘,提出一种基于堆排序及链表结构的改进Apriori算法。算法通过扫描数据库,统计得到各个项目集在所有事务集中出现的频率,并按照项目集的频率次数进行堆排序。然后根据建立的堆得到所有k阶候选项目集并计算其相对应的支持度,将不同项目集的支持度与预先设定的最小支持度进行比较,若满足最小支持度,就将对应的频繁项目集加入链表中,否则依据剪枝策略剪去这个对应项,将通过连接运算生成的候选k+1阶项目集采用同样的操作可以生成k+1阶频繁项目集。这样可以很大程度上优化算法的频繁项目集的生成过程并加速了重要关联规则的生成过程,从整体上提高了运算速度。
-
-
-
-
-
吉根林;
东南大学计算机系;
杨明;
孙志挥
- 《第十九届全国数据库学术会议》
| 2002年
-
摘要:
本文对分布式数据库系统中频繁项目集的更新问题进行探讨,既考虑了数据库中事务增加的情况,又考虑了事务删除的情况.给出了分布式关联规则挖掘系统DAMINER的体系结构,提出了一种基于DAMINER的局部频繁项目集的更新算法ULF和全局频繁项目集的更新算法UGF.该算法具有通信代价小和时间开销少等优点.
-
-
王德兴;
胡学钢;
王浩
- 《中国电子学会第八届青年学术年会暨中国电子学会青年工作委员会成立十周年学术研讨会》
| 2002年
-
摘要:
概念格通过内涵和外延及概念间泛化和例化的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在概念格的内涵中引入等价关系所得到扩展概念格,则进一步丰富了内涵间的关系,将概念外延量化得到量化概念格.利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率.
-
-
-
-
-
-
-
-
-
-
- 南京师范大学
- 公开公告日期:2021-10-29
-
摘要:
本发明公开了一种数据集频繁项集挖掘可用性评估方法,所述方法包括步骤:(1)设C={I1,I2,…,In}是项的集合,给定事务数据集D1和D2,其中每个事务T是一个非空项集,使得对D1、D2利用Apriori算法挖掘得到最大频繁项集集合,记为FIS1、FIS2;(2)将FIS1任一项集MIS1与FIS2的任一项集MIS2通过项集匹配算法F进行匹配,得到配对项集表Pairs,Pairs由项集对组成,score1表示MIS1、MIS2的项目相似度,在匹配过程中计算得到。(3)对Pairs中的每一项,计算MIS1,MIS2的支持度相似度score2,进一步计算得到MIS1,MIS2的复合相似度score,更新pair为;(4)将Pairs中的每一项的复合相似度score累加,并除以Pairs中项的个数,得到D1和D2的相似度分数SCORE,且该分数的取值范围为[0,1]。
-
-
-
-
-
-