序列模式挖掘
序列模式挖掘的相关文献在2000年到2022年内共计238篇,主要集中在自动化技术、计算机技术、教育、无线电电子学、电信技术
等领域,其中期刊论文159篇、会议论文11篇、专利文献115135篇;相关期刊81种,包括电脑知识与技术、计算机工程、计算机工程与设计等;
相关会议11种,包括全国第26届计算机技术与应用学术会议、第十四届全国软件与应用学术会议、北京邮电大学信息工程学院第四届学术年会等;序列模式挖掘的相关文献由591位作者贡献,包括武优西、王珠林、田雨农等。
序列模式挖掘—发文量
专利文献>
论文:115135篇
占比:99.85%
总计:115305篇
序列模式挖掘
-研究学者
- 武优西
- 王珠林
- 田雨农
- 陈明婕
- 王月华
- 赵晓倩
- 刘锦
- 耿萌
- 刘亮
- 井溢洋
- 余啸
- 刘进
- 吴思尧
- 孟玉飞
- 宋安琪
- 崔晓晖
- 张建升
- 王晓雪
- 胡孔法
- 吴信东
- 吴孔玲
- 张巍
- 户倩
- 李杨
- 王巍
- 王珍
- 缪裕青
- 罗岚方
- 胡学钢
- 贾焰
- 金士尧
- 钟诚
- 陈崚
- 韩伟红
- 任家东
- 任芳
- 倪友聪
- 傅翔
- 全拥
- 刘建毅
- 刘睿
- 刘靖宇
- 原野
- 史巧硕
- 叶凯
- 司刚全
- 吉根林
- 吕明琪
- 吕芳
- 周嘉伟
-
-
赵晓倩;
武优西;
王月华;
李艳
-
-
摘要:
时间序列记录的是某一统计量按照时间推移而发生变化的数据,寻找合理的挖掘算法解决时间序列问题具有很强的现实意义。提出一种保序序列挖掘方法,通过子模式匹配结果挖掘(read the sub-pattern matching for mining,RSMM)算法,挖掘时间序列中频繁出现的趋势变化,在计算支持度时根据子模式的匹配结果得到超模式的支持度,在一遍扫描时间序列的情况下挖掘出所有的频繁保序模式。从理论上证明了RSMM是满足Apriori性质的完备性算法。在真实数据集上进行的实验表明,与其他对比算法相比,运行时间显著减少,从而验证了RSMM算法的高效性。
-
-
杨吉云;
范佳文;
周洁;
高凌云
-
-
摘要:
基于API调用序列的Android恶意代码检测方法大多使用N-gram和Markov Chain来构建行为特征实现恶意代码检测,但这类方法构造的特征序列长度受限且包含不相关的调用序列,检测精度不高。提出了一种基于行为模式的Android恶意代码检测方法。首先,通过调用序列约简和调用序列合并,提取了最长敏感API调用序列;然后,定义了加权支持度,在此基础上提出了改进的序列模式挖掘算法,挖掘不同类别样本中具有高区分度的序列模式作为分类特征;最后,使用不同的机器学习算法构建分类器实现恶意代码检测。实验结果表明,提出的方法在Android恶意代码检测中的精确度达到了96.11%,比基于API调用数据的两种同类恶意代码检测方法分别提高了4.60个百分点和2.11个百分点。因此,提出的方法能有效检测Android恶意代码。
-
-
程罡;
孙迪;
罗恒
-
-
摘要:
随着在线学习的发展,在线学习平台积累了大量的学习者微观学习行为的数据。越来越多的研究人员提出利用这类由技术支持的数据来研究学习过程中交互行为的序列和时间模式,也就是行为序列模式的挖掘与研究。该文聚焦于大规模私有在线课程中的学习者微观交互行为,尝试运用序列挖掘的方法来探讨行为模式的演变,并对不同成就群体之间的模式进行了比较,揭示了高、低成就学习者群体的主要交互模式及其演变趋势,并且就两个群体的模式进行了比较。该研究结果为细粒度层面的交互行为模式的研究提供了一个新的视角,有助于教师进一步了解学习者的在线行为,并针对不同学习者设计专门的干预措施。对于学习平台开发者来说,该研究提供了关于微观在线行为模式的挖掘、呈现和解释的有益尝试,为平台功能的设计和实现提供帮助,此外,还可以帮助教学设计者构建以学习者为中心的课程来促进在线学习。
-
-
吴军;
欧阳艾嘉;
张琳
-
-
摘要:
针对传统序列模式挖掘算法中支持度不能如实体现序列模式兴趣度以及未对报告的序列模式进行质量评估的问题,提出一个基于影响度的统计显著序列模式挖掘算法ISSPM。首先,递归地挖掘出所有满足兴趣度约束的序列模式;然后,使用项集置换方法构建这些序列模式的置换检验零分布;最后,通过该零分布计算出被评估的序列模式的统计度量值,并从上述序列模式中找到所有统计显著序列模式。真实序列记录集合上的实验结果表明,ISSPM算法相较于PSPM、SPDL和PSDSP算法挖掘到的序列模式数量更少但兴趣度更强;仿真序列记录集合上的实验结果表明,ISSPM算法报告的结果中假阳性序列模式数量平均占比为3.39%,且该算法的嵌入模式的发现率均不低于66.7%,明显优于上述3个对比算法。可见,ISSPM算法报告的统计显著序列模式能够体现序列记录集合中更有价值的信息,同时根据这些信息做出的进一步分析和决策也更加可靠。
-
-
傅骞;
唐文静;
王雯;
郑娅峰
-
-
摘要:
编程模式是指在代码中重复出现且具有结构意义的代码片段,准确识别高中程序设计所需的编程模式有助于教师把握编程教学的重点和途径,提升编程课程的教学效果.当前的编程教学研究鲜有关注编程模式对编程教学的意义,也未有研究明确高中编程教学中的编程模式内容和数量.为此,研究依据编程模式的结构特点,采用序列模式挖掘方法自动识别了高中阶段编程教学涉及的编程模式,并进行了有效性验证.结果表明,从现行高中信息技术课程必修"程序设计"模块识别的共计18种编程模式涉及多种基础知识点的复合应用,能够有效扩展编程教材中的教学知识范畴.研究还进一步阐述了编程模式的实践教学价值,并从教学内容、教学方法、教学资源三个方面给出了利用编程模式实施编程能力培养的具体方法.
-
-
宋宇;
丁莹;
朱佳;
许昌良
-
-
摘要:
开展互动式课堂教学既是优化教学方式的要求,也是教师专业化发展的重要表征.基于此,文章从国家教育资源公共服务平台选取300节课作为样本数据,采用序列模式挖掘方法,对初级、中级、专家型教师的课堂互动进行了对比分析,发现:初级教师和中级教师的课堂互动、课堂互动转换频次、课堂互动序列演进过程均较为相似,但与专家型教师的互动式课堂教学存在显著性差异:专家型教师的提问和引导更具有效性、策略性,通过深入互动更能触发学生的高阶思维和复杂认知能力,在互动功能延展方面更擅于搭建思维链条、认知网络并构建双螺旋上升的互动模式.文章的研究可为教师开展互动式课堂教学提供参考,并有助于优化课堂教学模式、促进教师专业发展,进而打造优质高效的课堂.
-
-
武优西;
刘茜;
闫文杰;
郭磊;
吴信东
-
-
摘要:
无重叠条件序列模式挖掘是一种间隙约束序列模式挖掘方法,与同类挖掘方法相比,该方法更容易发现有价值的频繁模式,其核心问题是计算给定模式在序列中的支持度或出现数,进而判定该模式的频繁性.而计算模式支持度问题实质是无重叠条件模式匹配.当前研究采用迭代搜索无重叠出现,然后剪枝无用结点的方式计算模式的支持度,其计算时间复杂度为O(m×m×n×W),其中,m,n和W分别为模式长度、序列长度及最大间隙.为了进一步提高无重叠条件模式匹配计算速度,从而有效地降低无重叠条件序列模式挖掘时间,提出了 一种高效的算法,该算法将模式匹配问题转换为一棵网树,然后从网树的最小树根结点出发,采用回溯策略迭代搜索最左孩子方式计算无重叠最小出现,在网树上剪枝该出现后,无需进一步查找并剪枝无效结点即可实现问题的求解.理论证明了该算法的完备性,并将该算法的时间复杂度降低为O(m×n×W).在此基础上,继续指明该问题还存在另外3种相似的求解策略,分别是从最左叶子出发迭代查找最左双亲方式、从最右树根出发迭代查找最右孩子方式和从最右叶子出发迭代查找最右双亲方式.实验结果验证了该算法的性能,特别是在序列模式挖掘中,应用该方法的挖掘算法可以降低挖掘时间.
-
-
-
-
张翔宇;
张强;
吕明琪
-
-
摘要:
交通拥堵指数预测是智能交通系统的核心能力之一.然而,现有方法大多采用回归模型,在长期交通拥堵指数预测任务上表现不佳.针对此问题,本文提出了一种融合演化模式挖掘和代价敏感学习的交通拥堵指数预测方法.首先,采用序列模式挖掘算法从交通拥堵指数历史数据中发现长期演化模式.同时,采用代价敏感学习技术对交通拥堵指数数据与多种时空特征之间的关联进行学习.最后,通过Stacking框架对演化模式挖掘和代价敏感学习的能力进行融合.基于杭州市真实交通拥堵指数数据集进行的实验表明,本文提出的方法对未来5天交通拥堵指数的预测误差比现有方法降低了10%以上.
-
-
张晓彤;
郑年亨;
刘三女牙
- 《第22届全球华人计算机教育应用大会》
| 2018年
-
摘要:
MOOC的出现不仅改变了高等教育的生态环境,而且促进了小规模限制性在线课程(SPOC)的发展.为了了解学生在SPOC平台的行为,本研究收集了他们一个学期内在平台上的操作记录,并用序列模式挖掘算法分析了学生的在线学习行为.研究结果发现3个主要的学生的频繁行为序列,与学习课程资源、查看资源统计和查看作业模块有关.
-
-
Xu Bo-Wen;
徐博文;
Xia Xin;
夏鑫;
Cai Zhen-Gong;
才振功;
Zhang Yun;
张芸;
Li Shan-Ping;
李善平
- 《第十四届全国软件与应用学术会议》
| 2015年
-
摘要:
随着应用软件功能的不断扩展,项目规模也随之迅速增大,同时也给整个代码工程增加了巨大的维护和重构成本代码克隆检测作为减少软件维护成本,提升软件重构效率的重要手段,已成为众多高效维护和重构工作中不可或缺的一部分如何有效地检测出克隆代码是工程师们亟待解决的问题本文提出一套完整的基于机器学习算法来检测代码克隆的方法(Sequence Pattern Mining and Bayes,SPMB)尤其是对实现相似或相同功能逻辑的克隆代码集合进行序列模式挖掘,利用挖掘出的特征序列构造出基于朴素贝叶斯算法的分类器进行测试代码的功能分类,通过分类的结果来判断克隆代码的业务逻辑此外,该方法还包含反馈机制,通过不断优化训练集,使其具有不断自我学习的能力将SPMB方法应用于IJaDataset 2.0数据集的实验结果表明,通过不断调优阈值,将F1-Score从0.65提高到了0.96,为代码克隆提供了一种有效的检测手段.
-
-
-
- 《第二十五届中国数据库学术会议(NDBC2008)》
| 2008年
-
摘要:
提出了一种面向网络安全的序列模式挖掘方法。引入IP约束窗口的概念,利用IP地理信息和IP拓扑信息建立IP约束窗口模型,并且使用时间滑动窗口进行序列模式挖掘,是一种在特定领域中基于约束的序列模式挖掘方法。可以有效减少候选集数量,提高挖掘效率,实验证明这是一种有效的特定领域应用的序列模式挖掘方法。
-
-
崔巍;
武森;
高学东
- 《信息系统协会中国分会第二届学术年会》
| 2007年
-
摘要:
本文首先分析了Web个性化服务对序列模式挖掘的要求,然后针对传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度的特点,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从而可加速剪枝,提高算法效率,为提高web个性化服务提供了一个有效的方法。
-
-
窦赫男;
刘正捷;
夏季
- 《第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议》
| 2006年
-
摘要:
为提高网站可用性,许多网站可用性分析人员使用传统的可用性方法。但是传统的这些方法存在许多缺陷,如因为测试使用小样本的用户代表,造成测试得出的信息量的有限性;实验室环境与真实使用环境的不同造成的测试数据的不真实性等。为弥补这些研究方法的不足,本文作者尝试从网站日志中获取用户浏览行为,作者采用序列模式挖掘的方法从网站日志中提取用户访问网站的行为模式,通过对用户访问模式的分析,帮助可用性分析人员发现网站存在的可用性问题。这种方法能够避免传统可用性方法的缺点,但在实际应用中,由于日志文本的信息量十分庞大,可用性分析人员并非能够轻松找出所有用户访问网站的路径.因此,本文作者设计并实现了一个可以辅助分析人员发现网站可用性问题的工具,该工具应该具有良好的交互性能,令网站维护人员和可用性分析人员能够调整挖掘条件,进行有选择、有针对地挖掘。通过对工具开展的试验性应用案例研究,及通过专家评估和用户测试方法的验证,说明该工具可以辅助网站维护人员和可用性分析人员发现网站中存在的可用性问题并得到相应的解决方案,验证了工具的有效性和开发价值。
-
-
-
-
宫生文;
国刚;
夏临华
- 《2003年全国理论计算机科学学术年会》
| 2003年
-
摘要:
本文提出了一种高效的挖掘方法,这种方法挖掘的是被大多数序列所粗略存在的模式,而不是严格的匹配模式.这种方法挖掘的是数据库中的长序列模式,而不是所有模式的集合,因为长序列模式更具有代表性及有着广泛的应用.随着数据挖掘中聚类分析的日益完善,这种方法将越发显示出其高效性及实用性.
-
-
李洋;
胡学钢
- 《第六届中国Rough集与软计算学术研讨会(CRSSC'2006)》
| 2006年
-
摘要:
本文在基于数据项约束的条件下研究了如何更加有针对性地挖掘长闭合序列模式,通过实验证明,与传统的闭合序列挖掘方法相比,基于约束的倒序闭合序列挖掘算法InverClos不仅拥有更高的时空性能,并且有更好的实际应用前景.如何避免预先设定的支持度阈值对闭合序列的产生及决策支持的负面影响,将是下一步研究的目标与方向。
-
-
- 哈尔滨工业大学(威海)
- 威海天之卫网络空间安全科技有限公司
- 公开公告日期:2021.03.05
-
摘要:
本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。
-
-
-
-
-
-
-
-
-