频繁模式
频繁模式的相关文献在2002年到2023年内共计477篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、科学、科学研究
等领域,其中期刊论文356篇、会议论文27篇、专利文献62536篇;相关期刊157种,包括计算机工程、计算机工程与科学、计算机工程与设计等;
相关会议24种,包括全国抗恶劣环境计算机第二十五届学术年会 、第29届中国数据库学术会议、第二十二届中国过程控制会议等;频繁模式的相关文献由1091位作者贡献,包括施伯乐、叶飞跃、汪卫等。
频繁模式—发文量
专利文献>
论文:62536篇
占比:99.39%
总计:62919篇
频繁模式
-研究学者
- 施伯乐
- 叶飞跃
- 汪卫
- 王晨
- 刘君强
- 王建东
- 胡运发
- 徐从富
- 秦亮曦
- 程舒通
- 胡学钢
- 马海兵
- 于戈
- 但红卫
- 刘铎
- 吴信东
- 孙志挥
- 宋世杰
- 庄毅
- 曾宇
- 朱潇
- 李国徽
- 李川
- 林怡
- 王乐
- 王水
- 王洁
- 胡华平
- 胡笑蕾
- 陈辉
- 倪友聪
- 刘丽娜
- 周忠眉
- 岳昆
- 常艳芬
- 张伟丰
- 张广路
- 张锦
- 朱永泰
- 李庆华
- 李战怀
- 李春平
- 杜春修
- 杨健
- 杨兵
- 杨艳霞
- 梁碧珍
- 武优西
- 沈良忠
- 潘云鹤
-
-
李玉伟;
杨庚
-
-
摘要:
在这个大数据时代,无论是数据量还是数据种类都在以极快的速度增长,因此数据挖掘技术在各行各业(例如移动轨迹预测、广告投递、医疗诊断等方面)中都得到了广泛的运用。频繁序列挖掘是数据挖掘领域中的一个重要方向,但是在挖掘过程中和发布序列数据时很有可能会泄露一些用户的隐私信息,产生严重的安全隐患。Dwork等人提出的差分隐私模型可以为数据挖掘的隐私保护提供安全保证,与传统的隐私保护方法(基于k-匿名及其扩展分组模型)相比,该模型通过添加噪音对数据进行扰动,即使攻击者拥有最大的背景知识也能达到差分隐私保护的目的。文章设计了一种渐进式序列挖掘差分隐私保护算法,该算法通过改进的稀疏向量技术实现对挖掘过程添加拉普拉斯噪音,并对候选频繁序列的真实支持度以及阈值进行扰动。算法在理论角度被证明满足差分隐私,在真实数据集上的实验结果表明该算法具有较好的可用性。
-
-
赵晓倩;
武优西;
王月华;
李艳
-
-
摘要:
时间序列记录的是某一统计量按照时间推移而发生变化的数据,寻找合理的挖掘算法解决时间序列问题具有很强的现实意义。提出一种保序序列挖掘方法,通过子模式匹配结果挖掘(read the sub-pattern matching for mining,RSMM)算法,挖掘时间序列中频繁出现的趋势变化,在计算支持度时根据子模式的匹配结果得到超模式的支持度,在一遍扫描时间序列的情况下挖掘出所有的频繁保序模式。从理论上证明了RSMM是满足Apriori性质的完备性算法。在真实数据集上进行的实验表明,与其他对比算法相比,运行时间显著减少,从而验证了RSMM算法的高效性。
-
-
屈尹鹏;
徐箭;
姜尚光;
柳玉;
孙元章;
柯德平
-
-
摘要:
风电爬坡事件的统计特性建模和精准预测有利于电网的安全稳定运行.文中首先通过参数分辨率自适应算法对大型历史风电数据库进行爬坡事件检测,得到风电爬坡事件的历史学习集.对该学习集进行数据挖掘,建立了单个爬坡事件的起点、终点、持续时间以及爬坡间隔的多属性联合统计特性模型,并得到爬坡事件的基本模式.通过关联规则算法建立了多个相邻爬坡事件之间的自相关性统计特性模型.在此基础上,提出了爬坡事件序列预测算法的基本概念和模型.算例结果表明,所提算法能够更为直观地描述爬坡事件的统计特性,且基于事件序列的预测算法能够较好地进行日前的爬坡预测.
-
-
周健;
孙丽艳;
陈劲松;
杨家桂
-
-
摘要:
学习特征分析是智慧课堂研究的一个重要研究内容.文章利用知识点构建智慧课堂学习分析库,构造知识点频繁模式树,通过基于频繁模式树分析学生学习过程中对知识点学习的调用程度,从而建立学习轨迹,发掘知识点学习的潜在关联关系及频繁模式,分析学生学习的特点,提高智慧课堂教学的学习效率.
-
-
李峰
-
-
摘要:
剪枝策略(pruning mechanisms)是频繁模式挖掘算法常用方法之一,通过该策略可以快速克服工业生产中可能发生的金融危机,从而最大限度地提高制造业的生产能力.现有的剪枝策略算法仅考虑每个产品的利润信息,不考虑产品的权重,所以效率低下.提出了一种新的剪枝挖掘算法.通过基于低估值的约束和组件权重的挖掘索引器进行的有效剪枝挖掘,不但考虑了利润信息,而且考虑了权重信息.实验表明,该方法能节省大量的运行时间,大幅提高挖掘效率.
-
-
王培培;
孟芸
-
-
摘要:
针对传统数据关联挖掘过程只适用于单段数据集,导致内存负担重、挖掘频繁项集效率不高等问题,提出一种多段支持度数据频繁模式关联规则挖掘方法.运用多支持度算法对数据集逐步搜索,数据集按照数据项的MIS大小有序排列,采用最小值作为最小支持度,确保该算法的地推性.构建FP_ tree树,利用FP_tree算法对待选项实施剪枝,从而准确挖掘出频繁模式的关联规则.仿真结果证明,多段支持度数据频繁模式关联规则挖掘具有较好的性能,有效提高了关联规则的挖掘效率.
-
-
李洁
-
-
摘要:
为了提高图数据频繁模式的分析效果,提出基于解耦概要图的图数据频繁模式挖掘算法.构建闭频繁项特征分析模型,采用解耦概要图模式分析方法进行图数据频繁模式特征检测,根据图数据频繁模式数据的混合分类属性进行相似度分析,提取图数据频繁模式数据的数值属性特征和分类特征,结合自相关特征检测方法进行图数据频繁模式挖掘的统计分析,建立图数据频繁模式挖掘的模糊相关性融合模型,采用解耦概要图检测方法进行图数据频繁模式挖掘过程中的特征提取,建立图数据频繁模式挖掘的特征提取和分类模型,采用大数据融合方法进行图数据频繁模式挖掘的模式匹配和信息融合聚类,根据信息融合结果实现对图数据频繁模式挖掘优化.仿真结果表明,采用该方法进行图数据频繁模式挖掘的自适应性较好,数据挖掘的精度较高,提高了图数据频繁模式检测和特征分析能力.
-
-
魏坤;
王芳;
黄树成
-
-
摘要:
FP-growth算法是关联规则挖掘中一种经典的算法,它不需要产生候选集,只需要扫描事务数据库两次来构建项目头表和FP-Tree.但该算法项节点查询比较耗时,而且要递归生成条件FP-tree,所以内存开销大.针对上述问题,文中提出了一种基于FP-growth的新的频繁模式挖掘算法MGFP-growth.其思想是:首先算法弃用项目头表,使用二维矩阵存储事务的信息,按照矩阵列进行分组,并建立parenttrace关系;最后利用存储在数组中的gourp信息可以快速的构建频繁模式树,从而进行频繁项集的挖掘.实验表明,该算法只对事务数据库扫描一次,同时利用分组将项存储,节省了内存空间,有效解决了传统算法的固有缺陷,提高了算法效率.
-
-
李剑宇;
岳昆
-
-
摘要:
知识图谱(Knowledge Graph,KG)中的关联实体发现任务旨在为用户输入的查询实体推荐一组最相关的实体集合.许多实体在KG中没有显式地链接,但隐式地关联在用户生成的数据中.因此,引入用户数据可得到更加丰富的实体关联信息,利用用户与实体的交互信息(记为用户−实体数据)可提高KG关联实体发现的准确性.基于用户−实体数据中挖掘到的频繁项,首先,构建实体关联规则(Entity Association Rule,EAR)对实体间的关联信息建模,并利用置信度评估实体间的关联强度;然后,基于分支限界法算法获得最优的实体关联规则,得到与查询实体最相关的关联实体集合.在两个真实世界数据集上的实验结果表明,相较于传统基于KG结构的方法,EAR发现top 1关联实体的准确率分别提高了10.7%、4.1%.
-
-
-
- 《全国抗恶劣环境计算机第二十五届学术年会》
| 2015年
-
摘要:
随着全球定位系统、手持移动设备和射频识别等设备的普及,导致越来越多的应用跟踪并记录移动物体的轨迹,并以标记时间戳的位置点的方式表示形成了大量的时空数据.从中可以学习和发现频繁模式,这些模式标明移动物体经常活动的移动路线.频繁模式挖掘不同于用于交易数据中传统的频繁项挖掘,其难度在于:(1)移动对象位置的不确定性,即使同一移动物体相同时间段,也不会产生完全一致的时空数据;(2)移动对象位置数据的稀疏性,出于隐私或设备低采样率等原因,采集的数据会缺失现象.因此,本文首先采用栅格模型对地理信息进行编码,然后定义了频繁模式,挖掘出隐藏在数据中的移动对象行为知识.最后,将本文的成果应用于实际数据上得到了比较满意的结果.
-
-
-
Qiao Shaojie;
乔少杰;
Shen Zhiqiang;
沈志强
- 《第29届中国数据库学术会议》
| 2012年
-
摘要:
随着各类无线移动设备(如智能手机、平板电脑、GPS导航仪等)的广泛普及,各种基于位置变化信息而提供相关服务的工具日渐受到研究者的关注.借助这类工具,用户可以对路况等一系列信息做出更加准确和有价值的判断和决策.为更好地满足用户的位置跟踪预测需求,借助于Java及Eclipse开发平台,设计实现了一种基于频繁模式的不确定性轨迹预测系统PathExplorer.考虑到移动对象历史轨迹存在的诸多不确定性,PathExplorer首先通过轨迹补全算法得到完整的路径序列,然后利用频繁模式挖掘和轨迹匹配计算移动对象最可能的运动路径.系统充分考虑了如何提高运行效率以及节省储存空间的需求,通过对比PathExplorer预测轨迹的效率与最短路径查询算法的效率,展示了系统的性能优势.
-
-
-
ZHOU Shunxian;
周顺先
- 《第22届全国计算机新科技与计算机教育学术会议》
| 2011年
-
摘要:
针对频繁模式挖掘过程中不能事先确定最小支持度阈值的问题,提出一种新的频繁模式挖掘算法来得到最佳支持度阈值.算法通过支持度阈值、频繁项次数以及频繁数的线性组合,生成了一个能对频繁模式挖掘效果做出评估的判决函数,它能直观且较为准确的反应频繁模式的挖掘效果.此判决函数先选取一个较小的阈值作为支持度的初始阈值,然后对支持度阈值按指数递增,分别计算不同支持度下的判决函数结果,当判决函数结果达到拐点时,再对支持度值进行线性递增,判决函数再次到达拐点时,则判定到达该次拐点之前的阈值为最佳支持度阈值.实验结果表明,新算法较Apriori算法具有更好地频繁模式挖掘效果.
-
-
-
-
李小斌;
钱建生;
赵志凯;
王卿斌;
宋万宝;
何霁野
- 《第二届全国智能信息处理学术会议》
| 2009年
-
摘要:
频繁模式的发现是数据挖掘中非常重要且很有意义的一项工作,然而通常情况下生成的频繁模式数量非常巨大,因此如何有效地表示挖掘到的频繁模式就变得尤其重要,提出一种新的频繁模式的约简表示方法,即利用支持向量回归(SVR)方法对频繁模式进行拟合,根据参数调节最后的压缩比和总误差,对于大数据量不便于SVR一次计算的情况,提出利用聚类方法将得到的频繁模式进行分区,然后利用SVR方法对各个区的频繁模式进行回归分析,两者比较的结果表明一次性的全局拟合的效果更好.通过实验验证表明了该方法的有效性.
-
-
-
- 《第二十五届中国数据库学术会议(NDBC2008)》
| 2008年
-
摘要:
中医方剂内药物配组的作用受方剂语境影响,药物搭配方式不同,功效则不同,药物配伍原理和机制尚不明确,是中医古方研究的重要内容.发现频繁药组,并对其进行功效标注可以多粒度、多维度、多方向,更深入地研究中药方剂药物配伍规律,对中医药学科研究具有重要意义,提出并形式化描述了该问题,讨论了相关性质,设计并实现了可直接进行多表关联分析的基于逆索引的2阶段频繁模式挖掘方法,讨论了算法特性。通过在真实古方数据集上较全面深入的实验研究,表明新算法可行、效果良好,合理及良好标注率可达71%左右,所有结果均对中医药物配伍及功效关系研究有参考价值.