模式挖掘
模式挖掘的相关文献在2001年到2023年内共计477篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理
等领域,其中期刊论文138篇、会议论文10篇、专利文献90813篇;相关期刊84种,包括电子学报、电子设计工程、现代电子技术等;
相关会议9种,包括第29届中国数据库学术会议、2011全国开放式分布与并行计算学术年会、2008全国软件与应用学术会议(NASAC'08)等;模式挖掘的相关文献由1133位作者贡献,包括黄名选、武优西、王珠林等。
模式挖掘—发文量
专利文献>
论文:90813篇
占比:99.84%
总计:90961篇
模式挖掘
-研究学者
- 黄名选
- 武优西
- 王珠林
- 陈明婕
- 田雨农
- 邓敏
- 刘锦
- 王月华
- 赵晓倩
- 韩萌
- 耿萌
- 刘启亮
- 宋国杰
- 张磊
- 王丽珍
- 王静远
- 石岩
- 井溢洋
- 伍之昂
- 余啸
- 俞东进
- 刘亮
- 刘进
- 刘铎
- 刘陈
- 吴思尧
- 周丽华
- 周波
- 唐世渭
- 孟玉飞
- 宋安琪
- 崔晓晖
- 张建升
- 张强
- 张扬
- 徐欣
- 曹杰
- 曾宇
- 朱潇
- 李先贤
- 杨亮
- 杨冬青
- 林怡
- 王洁
- 王金艳
- 丁志军
- 于汪洋
- 倪友聪
- 刘文凯
- 吕明琪
-
-
张妮;
韩萌;
王乐;
李小娟;
程浩东
-
-
摘要:
高效用模式挖掘(HUPM)是新兴的数据科学研究内容之一,通过考虑事务数据库中项的单位利润和数量,以提取出更有用的信息。传统的HUPM方法假定所有项的效用值均为正,但是在实际应用中,某些数据项的效用值可能为负(如商品因产生亏损而导致利润值为负),含负项的模式挖掘与仅含正项的模式挖掘同样重要。首先,阐述了HUPM的相关概念,并分别给出相应正负效用的实例;然后,以正与负角度划分了HUPM方法,其中带有正效用的模式挖掘方法进一步以动态与静态的数据库新颖角度划分,带有负效用的模式挖掘方法中包括了基于先验、基于树、基于效用列表和基于数组等关键技术,并从不同方面对这些方法进行了讨论和总结;最后,给出了现有HUPM方法的不足和下一步研究方向。
-
-
黄海波
-
-
摘要:
数据挖掘技术是一种从数据本身进行考虑的分析技术,能够对数据进行科学分类、数据估计、分类预测、关联分组以及时序数据列序模式挖掘,通过一系列的挖掘流程运用,得出更加具有价值和意义的数据,为决策提供良好的支持。数据挖掘技术在股票数据分析当中也具有一定的应用价值,数据挖掘技术在股票数据分析中应用,需要深入不同类别算法的特点和算法,从而发挥其运算优势,得出更加准确地股票数据分析结果,为股票投资提供更加可靠的依据。
-
-
李慕航;
韩萌;
陈志强;
武红鑫;
张喜龙
-
-
摘要:
复杂高效用模式挖掘是当前研究的一个新兴主题。本文首次从高效用融合模式和衍生模式2个角度进行讨论。首先,对于融合模式,根据数据结构的不同对高效用序列模式进行分类论述;按照时间顺序对高效用片段模式、周期高效用模式进行概述。针对衍生模式,从数据结构角度对高平均效用模式、带有负项的高效用模式、on-shelf高效用模式进行总结;从精简类型角度概述精简高效用模式,并对现有融合模式和衍生模式挖掘算法的优缺点、上边界等进行对比分析。最后,针对现阶段研究缺陷与不足,给出了下一步研究方向,包括不确定数据中的高效用模式挖掘方法、数据流上的高效用on-shelf模式挖掘方法和大数据环境下的并行高效用模式挖掘方法。
-
-
-
陈景琪;
丁凌
-
-
摘要:
建筑是能源消耗的重要载体,楼宇是城市建筑的关键形式,为达到节能增效的目的,提出基于模式挖掘的智能楼宇能源消耗量预测方法。分析智能楼宇的类型与系统结构,从微观到宏观角度构建楼宇集群数学模型。采用序列模式挖掘算法扫描能耗历史数据库,选出长度为1的频繁序列。构建三角矩阵,并对频繁序列的子集作递归挖掘,对所有挖掘出的频繁项集排序并获取权重,将权重较高的历史数据作为预测依据。确定模糊预测准则,计算离散论域中的语言值,生成运动器,计算不同预测结果的模糊权值,综合权重影响获得最终的能耗量预测结果。仿真实验表明,该方法对于不同类型的智能楼宇,都能得到较为精准的预测结果。
-
-
赵奎;
闫玉芳;
曹吉龙;
高延军
-
-
摘要:
预测宫颈癌的诊疗项目是辅助医生诊疗的重要手段,文中针对宫颈癌患者住院数据的复杂性以及现有时间序列预测技术的不足,提出了创新性的诊疗过程规范化判断的两段式预测模型Bi-GRU-DT,同时对比验证了GRU-2、Bi-GRU、GRU-2-DT、FL-LSTM、Phased LSTM、AMNN的模型性能.具体而言,首先用加权池化的方式对住院数据进行处理,用Skip-gram算法将处理后的数据表示成向量;然后,利用二分K-means算法挖掘规范的诊疗模式,利用基于Bi-GRU的循环神经网络构建诊疗项目预测模型.在预测未来诊疗项目前,首先对诊疗过程进行规范化判断,并将相邻诊疗日的时间间隔融入到输入数据中.实验结果表明,相较于未规范化判断的情况下,模型的召回率和平均准确率分别提高了6.4%和5.3%.
-
-
毛群;
王微微;
尤枫;
赵瑞莲;
李征
-
-
摘要:
软件测试是保障Android应用质量的有效手段,而理解Android应用的功能作为Android测试过程的基础,旨在深入探究应用的业务逻辑并发现其功能问题,在测试中尤为重要。用户行为模式可充分辅助测试人员理解Android应用功能,从而提高测试效率。基于“相似Android应用共享用户行为模式”的构想,提出一种Android应用的用户行为模式挖掘及复用方法,以降低Android应用测试成本并提高测试效率。具体而言,针对待测Android应用,从其相似Android应用挖掘出用户行为模式;然后利用基于语义的事件模糊匹配策略为待测应用寻找对应事件,并基于用户图形界面(GUI)模型的最优路径选择策略为待测应用生成目标事件序列,从而实现相似应用间的用户行为模式复用。针对三类应用的32种用户行为模式进行实验,结果表明,87.4%的行为模式可在相似Android应用上被完整复用,并且被复用的行为模式可有效覆盖待测应用中90.2%的重要状态。可见,所提方法为Android应用测试提供了有效支撑。
-
-
张春砚;
韩萌;
孙蕊;
杜诗语;
申明尧
-
-
摘要:
通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述.首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关键技术进行分类,包括基于Apriori、基于树、基于列表、基于映射、基于垂直/水平数据格式、基于索引等方法.针对现有关键技术的用途和优缺点进行了全面概述,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法、基于滑动窗口模型方法、基于时间衰减模型方法、基于地标模型方法等.最后,给出了现有技术的不足和改进方向,并且有针对性地提出了新的研究方法.
-
-
张凤玲
-
-
摘要:
拼多多的商业逻辑,其实很简单——"抱走马斯洛需求的塔基",用9块9包邮的模式挖掘马斯洛需求的塔基。理解了这句话,也就真正理解了拼多多。拼多多到了尴尬的时刻。2020年12月29日凌晨1点30分,拼多多女员工在与同事一起走路回家的路上突然捂腹,晕厥倒地,后抢救无效,不幸离世。2021年1月9日18时,拼多多通报了一员工在长沙家中跳楼自杀的事件。即使这样,拼多多在活跃买家、增长速度的强劲表现,还是打动了投资者,拼多多的股价一夜狂涨。
-
-
陈宝国;
宋旸
-
-
摘要:
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法.构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合.建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的自适应学习与寻优控制,实现Web日志频繁序列模式挖掘.仿真结果表明,采用该方法进行Web日志频繁序列模式挖掘的误差较低,收敛性较好.
-
-
-
-
-
-
- 《2008全国软件与应用学术会议(NASAC'08)》
| 2008年
-
摘要:
程序员在进行软件维护时往往需要考虑代码之间的依赖关系而修改多处代码。目前软件中普遍存在大量采用不同编程语言编写的辅助文件,采用程序分析的方法难以发现与其有关的依赖关系。本文采用频繁模式挖掘的方法对软件演化历史进行挖掘,发现修改模式,即在历史上相对频繁的同时发生修改的方法和辅助文件集合。本文采用抽象语法树比较的方法提取发生修改的方法,以开源项目Eclipse为例进行分析,提取其修改模式,抽样统计修改模式中的结构关系和非结构关系,应用查全率和查准率描述修改模式对代码变化的预测效果。实验表明修改模式既能反映部分程序分析可以发现的结构关系,也可以发现程序分析难以发现的非结构关系,并具有较高的查全率和查准率,能够在一定程度上辅助程序员进行软件修改。
-
-
宋国杰;
唐世渭;
杨冬青;
王腾蛟
- 《第二十一届中国数据库学术会议》
| 2004年
-
摘要:
本文研究的重点是数据流环境中异常模式的提取与趋势监测,提出了一个进行异常模式发现的度量框架--强度比率,为异常模式挖掘提供了度量标准;在基于异常模式求取的基础上,提出了利用回归分析方法--最小二乘法进行异常模式趋势监测,实验结果表明,提出的异常模式度量和求取算法是合理的,提出的趋势监测方法是有效的、可行的。
-
-
宋国杰;
王腾蛟;
唐世渭;
杨冬青
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文结合数据流和频繁模式挖掘本身的特性,提出了一个启发式分段求解方法.该方法将数据流分成不同的段,利用Hoeffding Bound估算满足求解结果精度的段长度,通过逐段的迭代进行频繁模式的评估,最后估算出所有的模式.然后提出模式维护算法对这些评估模式进行维护.
-
-
冯玉才;
詹伟;
朱虹;
张勇
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本入侵检测系统经过在华中电力公司的财务管理系统进行的实验证明该系统能有效地检测入侵行为.由于使用了距离度量和相关度指导模式挖掘和模式比较过程,成功地建立了角色的正常行为模式和当前行为模式,在检测过程中,很好地体现了正常行为模式和异常行为的差异,及时发出警报.把基于统计分析的方法和基于规则/特征的方法结合起来,提高了系统的准确性,与传统的在文件层上进行分析的入侵检测系统相比,有效地降低了虚敬率.利用角色建模,与利用用户建模的方法相比较,能够得到更一般和更规则的行为模式,建立了关于行为模式的知识库.
-
-
宋国杰;
马帅;
唐世渭;
北京大学视觉与听觉信息处理国家重点实验室;
杨冬青
- 《第十九届全国数据库学术会议》
| 2002年
-
摘要:
智能交通系统是解决交通阻塞、确保交通安全和减少交通预算等的有效保障,其中一个核心问题是采取有效的方法,实施对将来交通状况的预测.目前主要有四种类型的预测方法:基于历史数据的方法、基于时间序列分析的方法、基于仿真方法和基于神经网络的方法.它们或者只考虑现实状况或者只注重历史规律,没有很好地将现实状况和历史行驶规律结合.单纯地依靠以往数据中蕴涵的规律模式不能很好的实时而确切地预测当前的活动,只有与当前实时的交通状况结合,才能更好地进行交通预测.本文提出了一个新的预测方法.该方法结合了基于模式预测的长远性和基于当前状况的实时性,从而使得预测不但具有"远见性",而且具有较好的"实时性",使得实时预测的可行性和准确性得到保证.
-
-
钟诚;
罗程;
广西大学行健文理学院
- 《2007全国理论计算机科学学术年会》
| 2007年
-
摘要:
利用核函数构造数据的特征空间并在此空间采用核函数结合RA算法选取初始聚类中心,在核k-means聚类基础上,划分出大簇小簇,然后在大簇中进行异类分离以发现实验数据中以小概率事件出现的R2L,U2R和PROBE攻击;并且在大簇中挖掘闭合序列模式,获得描述大簇的序列规则,从中判断是否存在DoS攻击.算法分析和实验结果表明提出的方法可以获得较高的检测率并降低误报率.