首页> 中文期刊> 《软件学报》 >一种带稀疏间隙约束的并行模式匹配算法

一种带稀疏间隙约束的并行模式匹配算法

         

摘要

带通配符的模式匹配是一个经典的研究问题,带有可变间隙约束的模式匹配是近年来比较热门的研究方向.为适应某些查询精度要求较高的应用领域,提出一种在稀疏间隙约束条件下求解模式匹配完备解的算法SGPM-SAI(pattem matching with sparse gaps constraint based on suffix automaton index).SGPM-SAI通过对文本串预处理,建立一种称为W-SAM的图索引结构,然后对模式串分段查找EndPos集合,最后以集合归并求交的方法得到模式匹配的完备解.实验结果表明:在不考虑预处理时间的情况下,相比几种最典型的模式匹配算法(KMP,BM,AC,suffix array),SGPM-SAI算法性能优势显著,至少高出3~5倍.通过与SAIL算法的最新优化版本(SAIL-Gen)进行比较,在稀疏间隙约束条件下,SGPM-SAI的性能要显著优于SAIL-Gen算法.此外,为有效利用现代处理器的大规模并行处理单元,提出了并行优化后的算法Parallel SGPM-SAI.实验结果表明:Parallel SGPM-SAI算法的加速效果显著,且具有良好的并行可扩展性,能够充分利用现代众核处理器的高并行计算优势.

著录项

  • 来源
    《软件学报》 |2018年第12期|3799-3819|共21页
  • 作者单位

    数据工程与知识工程国家教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    郑州轻工业大学软件学院;

    河南郑州450001;

    数据工程与知识工程国家教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程国家教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程国家教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程国家教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    模式匹配; 稀疏间隙约束; 后缀自动机; 并行算法; 通配符;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号