首页> 中国专利> 一种基于多叉树的正则表达式匹配方法、装置及系统

一种基于多叉树的正则表达式匹配方法、装置及系统

摘要

本申请实施例提供了一种基于多叉树的正则表达式匹配方法、装置及系统,通过对正则表达式的简化树进行节点融合,生成多叉树;然后,从多叉树中提取每个节点的常量字符,生成关键词词典,并根据关键词词典对目标文本进行分词;最后,根据目标文本的分词结果,从多叉树中匹配出命中路径,并将命中路径对应的正则表达式添加至命中集合。其中,多叉树将单独存在正则表达式聚类到了多叉树中的各个子树中,实现了节点总量的减少和同源表达式的聚类。在匹配命中路径时,由于每个子树的根节点不同,根据根节点能迅速定位到待匹配的子树,使后续的匹配过程仅会在待匹配的子树中进行,不再需要对正则表达式进行逐条匹配,减小了匹配量,提高了匹配效率。

著录项

  • 公开/公告号CN107992481B

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利权人 鼎富智能科技有限公司;

    申请/专利号CN201711425017.1

  • 发明设计人 李德彦;晋耀红;林谡;

    申请日2017-12-25

  • 分类号G06F40/284(20200101);G06F40/247(20200101);

  • 代理机构11363 北京弘权知识产权代理有限公司;

  • 代理人逯长明;许伟群

  • 地址 230000 安徽省合肥市高新区习友路3333号A1楼19层-B区

  • 入库时间 2022-08-23 11:44:41

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号