首页> 中文期刊>软件学报 >无重叠条件严格模式匹配的高效求解算法

无重叠条件严格模式匹配的高效求解算法

     

摘要

无重叠条件序列模式挖掘是一种间隙约束序列模式挖掘方法,与同类挖掘方法相比,该方法更容易发现有价值的频繁模式,其核心问题是计算给定模式在序列中的支持度或出现数,进而判定该模式的频繁性.而计算模式支持度问题实质是无重叠条件模式匹配.当前研究采用迭代搜索无重叠出现,然后剪枝无用结点的方式计算模式的支持度,其计算时间复杂度为O(m×m×n×W),其中,m,n和W分别为模式长度、序列长度及最大间隙.为了进一步提高无重叠条件模式匹配计算速度,从而有效地降低无重叠条件序列模式挖掘时间,提出了 一种高效的算法,该算法将模式匹配问题转换为一棵网树,然后从网树的最小树根结点出发,采用回溯策略迭代搜索最左孩子方式计算无重叠最小出现,在网树上剪枝该出现后,无需进一步查找并剪枝无效结点即可实现问题的求解.理论证明了该算法的完备性,并将该算法的时间复杂度降低为O(m×n×W).在此基础上,继续指明该问题还存在另外3种相似的求解策略,分别是从最左叶子出发迭代查找最左双亲方式、从最右树根出发迭代查找最右孩子方式和从最右叶子出发迭代查找最右双亲方式.实验结果验证了该算法的性能,特别是在序列模式挖掘中,应用该方法的挖掘算法可以降低挖掘时间.

著录项

  • 来源
    《软件学报》|2021年第11期|3331-3350|共20页
  • 作者单位

    河北工业大学人工智能与数据科学学院 天津 300401;

    省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津300401;

    河北省大数据计算重点实验室 天津 300401;

    河北工业大学人工智能与数据科学学院 天津 300401;

    省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津300401;

    河北省大数据计算重点实验室 天津 300401;

    河北工业大学人工智能与数据科学学院 天津 300401;

    省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津300401;

    河北省大数据计算重点实验室 天津 300401;

    省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津300401;

    河北工业大学电气学院 天津 300401;

    教育部大数据知识工程重点实验室(合肥工业大学) 合肥 230009;

    明略科学院明略科技集团 北京 100084;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 理论、方法;
  • 关键词

    模式匹配; 序列模式挖掘; 无重叠条件; 网树; 回溯策略;

  • 入库时间 2023-07-25 13:18:38

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号