首页> 中文期刊> 《软件学报》 >正则表达式分组的1/(1-1/k)-近似算法

正则表达式分组的1/(1-1/k)-近似算法

         

摘要

对正则表达式集合进行分组是解决DFA状态膨胀问题的一种重要方法.已有的分组算法大都是启发式的或蛮力的,分组效果很差.分析了DFA状态膨胀的原因,总结了某些正则表达式间的冲突状况.证明了当冲突非负和冲突独立时,正则表达式集合的最优k分组问题可归结为最大k割问题,从而说明该问题是NP-Hard的.基于局部搜索的思想,提出了一种分组算法GRELS来解决分组问题,并证明对最大k割问题,该算法的近似比是1/(1-1/k)与已有的分组算法相比,当分组数目相同时,GRELS算法分组结果的状态总数最少,并且集合发生变化时所需的更新时间最短.%Dividing regular expression sets into multiple groups is an important process to solve the problem of DFA state explosion. Previous grouping algorithms are heuristic or are done by brute-force, which have poor grouping results. This paper analyzes the reasons of states explosion and summarizes conflicting relationship among regular expressions of some types. When conflicts are non-negative and independent, the optimum k-grouping problem of regular expression sets can be reduced to the maximum k-cut problem, which is NP-hard. Based on the idea of local searching, a new grouping algorithm named GRELS is introduced to solve the problem efficiently, which is 1/(1-1/k) -approximation for maximum k-cut problem. Comparing with previous grouping algorithms, GRELS has the minimum number of states for the same number of groups, and requires the least time to update grouping results when pattern sets change.

著录项

  • 来源
    《软件学报》 |2012年第9期|2261-2272|共12页
  • 作者单位

    中国科学院计算技术研究所;

    北京 100190;

    中国科学院研究生院;

    北京 100049;

    信息内容安全技术国家工程实验室;

    北京 100190;

    中国科学院计算技术研究所;

    北京 100190;

    信息内容安全技术国家工程实验室;

    北京 100190;

    中国科学院计算技术研究所;

    北京 100190;

    中国科学院计算技术研究所;

    北京 100190;

    信息内容安全技术国家工程实验室;

    北京 100190;

    中国科学院计算技术研究所;

    北京 100190;

    信息内容安全技术国家工程实验室;

    北京 100190;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 理论、方法;
  • 关键词

    正则表达式; 深度包检测; 分组算法; 局部搜索; 1/(1-1/k)近似;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号