您现在的位置: 首页> 研究主题> 频繁集

频繁集

频繁集的相关文献在2000年到2021年内共计104篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、统计学 等领域,其中期刊论文93篇、会议论文6篇、专利文献60677篇;相关期刊62种,包括统计与信息论坛、科技信息、电信科学等; 相关会议6种,包括第二十二届全国信息保密学术会议(IS2012)、第二十五届中国数据库学术会议(NDBC2008)、全国第18届计算机技术与应用学术会议(CACIS)等;频繁集的相关文献由217位作者贡献,包括胡慧蓉、巫红霞、赵艳芹等。

频繁集—发文量

期刊论文>

论文:93 占比:0.15%

会议论文>

论文:6 占比:0.01%

专利文献>

论文:60677 占比:99.84%

总计:60776篇

频繁集—发文趋势图

频繁集

-研究学者

  • 胡慧蓉
  • 巫红霞
  • 赵艳芹
  • 刘渊
  • 吐松江·卡日
  • 周书恒
  • 安立奎
  • 崔屹平
  • 张婷婷
  • 张春瑞
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 白勇; 张占龙; 熊隽迪
    • 摘要: 为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测.首先,对待挖掘的电力文本进行指标提取并编码,生成电力文本初始FP-Tree;接着采用FP-Growth算法遍历所有FP-Tree,生成频繁集,过滤掉小于最小支持度的项,留下频数较高的频繁项;然后根据更新后的FP-Tree统计关联项,选择与总用电量增长率关联强的变量生成训练样本;最后采用GRNN算法对电力需求文本进行训练,输入电力需求预测样本,设置平滑因子,通过模式层的输出和加权求和来获得电力需求预测结果.实验结果证明,通过合理设置最小支持度和GRNN的平滑因子,能够获得较好的电力文本挖掘性能,与常用挖掘算法相比,所提算法能够获得更高的电力需求预测准确率.
    • 王永贵; 郭昕彤
    • 摘要: 针对基于Spark框架的关联规则算法存在I/O开销大、数据结构和挖掘频繁集方式单一、计算支持度的方式效率低等问题,提出基于SparkSql进行分布式编程的算法.将数据集加载到DataFrame,利用改进后的布隆过滤器高效存储频繁集挖掘过程中产生的项集,解决RDD内存资源和计算速度受限问题.基于先验定理对事务、项目和项集进行精简,同时提出用Sql语句对项集中项目对应事务集合求交集的方式计算项集支持度,提高计算支持度的效率.提出了两种迭代算法和自适应数据的选择条件,增强该算法对各种数据集的泛化性.进行多组实验,证明提出的算法总是自适应本次迭代数据的特点选择最优的迭代方法,同时具有较高并行算法性能,可以扩展到更大规模集群和数据;同基于Spark框架的关联规则算法YAFIM和R-Apriori进行对比,在每次迭代和总体运行计算效率上有更好的表现.
    • 朱岸青; 李帅; 唐晓东
    • 摘要: 为了提高关联规则挖掘效率,文中提出了一种适用于 Spark平台的并行化 FP_growth关联规则挖掘方法.首先,利用Spark平台在分布式系统中的所有节点的内存 RDD中完成遍历扫描运算,得到频繁集,以便生成 FP_Table 并更新 FP_Tree.然后,引入时间序列来预测待挖掘的项目集,以便实现分布式系统中的所有节点能够均衡分担挖掘任务,从而充分利用各节点的 FP_Tree遍历功能,获取 FP_growth关联规则挖掘结果.实验结果显示,相比单机情况,并行化 FP_growth关联规则挖掘在效率方面提高了约 60%.经过负载均衡处理后的 FP_growth关联规则挖掘的效率更高,提高了约 14%,这说明各节点遍历任务的分配更均衡,并行化程度更高.
    • 李海明
    • 摘要: 为及时从海量微博信息中迅捷有效提取出微博热点话题、事件,提出基于频繁集的聚类SSDKmeans算法,在有限空间下统计分词的近似频数,并在此基础上构建文本向量空间模型,在聚类生成的每个话题簇中提炼话题关键词.通过对2万条微博数据进行有效性验证,结果表明,基于SSDKmeans算法的话题发现有较高的召回率和精准率,分别为91.3%、92.1%.SSDKmeans算法能够有效提高微博热点话题发现率,进而及时了解社会热点话题与舆论趋势.
    • 李海明1
    • 摘要: 为及时从海量微博信息中迅捷有效提取出微博热点话题、事件,提出基于频繁集的聚类SSDKmeans算法,在有限空间下统计分词的近似频数,并在此基础上构建文本向量空间模型,在聚类生成的每个话题簇中提炼话题关键词。通过对2万条微博数据进行有效性验证,结果表明,基于SSDKmeans算法的话题发现有较高的召回率和精准率,分别为91.3%、92.1%。SSDKmeans算法能够有效提高微博热点话题发现率,进而及时了解社会热点话题与舆论趋势。
    • 赵明; 罗阳星; 蒋灿
    • 摘要: The Apriori algorithm has two major problems during computing the 2-frequent-itemsets:too many invalid candidate item sets and too much redundant scanning process.For solving this problem,this paper puts forward an improved algorithm called LZ-Apriori.It can improve the time complex effectively in computing the 2-frequent-itemsets and accelerate the whole process.It applies the algorithm to find out the association rules of stocks in shanghai and Shenzhen stock markets.The result proved that,compared to the origin Apriori,the LZ-Apriori showed better performance.%针对原始Apriori算法在计算二项频繁集时产生大量无效的候选集,以及对候选集进行了冗余的扫描这两个问题,文中提出一种改进算法LZ-Apriori,能够大大提升Apriori算法在计算二项频繁集过程中的时间效率,进而加速整个运算过程.将新算法运用到沪深股市板块联动的规则挖掘中,证实了新的算法具有良好的改进效果.
    • 张永雄; 余丙军; 邓志虹
    • 摘要: 在研究和分析Apriori关联规则算法缺陷的基础上,设计了一种效率更高的基于位向量的矩阵关联规则算法,通过实验验证了其可行性和有效性,并把该算法应用到教学评价中,挖掘出影响教学质量的相关因素,从而为学校改进教学管理工作提供客观有效的决策分析方法.
    • 赵秋实; 史燕中; 方志; 蒋遂平
    • 摘要: To detect car’s accompany vehicle in mass vehicle driving data, this paper analyzes the features of ac-company vehicle and principles of association rules mining. Finally, an algorithm based on frequent itemset is proposed in this paper. Support and time threshold of frequent itemset is set up to realize the process from single-itemset to multi-itemset with analysis car’s driving features on the road. The stream data is considered and a method is come up to solve the problem of new data in detecting accompany vehicle. Eventually, the result of the given car’s accompany ve-hicle can be detected quickly in mass data. Through the experiments, the proposed algorithm can get the accompany vehicle’s information quickly and right.%为从海量机动车行驶数据中找出车辆的伴随车辆信息,本文依据伴随车辆的行为特点及关联挖掘原理提出了一种基于频繁项集的伴随车辆检测算法。通过分析伴随车辆的行驶特点,设定频繁项集的支持度和时间阈值,实现了从单项集到多项集的迭代过程。利用流数据处理方法,添加了针对伴随车辆检测的流数据处理方法,最终使算法可以快速的在海量数据中检测到车辆的伴随车辆信息。经实验验证,本算法可以快速正确的检测出车辆的伴随车辆信息。
    • 纪怀猛; 陆林花; 黄风华
    • 摘要: 针对FUP算法在频繁集增量更新时,剪枝效率低下以及候选集验证速度慢的缺陷,提出了基于支持矩阵的频繁集增量更新的高效挖掘算法—SMFUP算法.该算法不仅采用支持矩阵进行整体剪枝来提高剪枝效率,而且进一步结合频繁2项集矩阵加快候选频繁集的验证速度,从而使算法的增量更新效率大大提高.最后通过实验证明了算法改进的有效性.
    • 黄剑; 李明奇; 郭文强
    • 摘要: 针对用户历史检索过程产生的Web日志文件,研究其查询词和点击链接是否为频繁集,以及在分布式条件下频繁集挖掘的效率问题.基于Hadoop框架,设计了并行Fp-growth算法,对搜索引擎Web日志进行挖掘.仿真实验结果显示,满足支持度的查询词和点击链接频繁集在Web日志中普遍存在.随着Hadoop节点数的增加,并行Fp-growth算法性能将得到大幅提高.由此,频繁集挖掘效率得到明显提高,且数据量越大,效率提升越明显.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号