首页> 中国专利> 短信文本模版的识别方法

短信文本模版的识别方法

摘要

本发明涉及文本审核技术领域,尤其是一种短信文本模版的识别方法,包括下述步骤:S1.取出需要去重的短信文本;S2.检测短信文本的字符集是否含有网址信息,若字符集中包含网址信息通过正则表达式识别并删除;S3.命名实体识别器识别短信文本中剩余的字符串;S4.删除命名实体器识别出的实体字符集;S5.检测短信文本的字符集是否有标点符号或者特殊字符。本发明不用设置匹配阀值和相似度阀值来判断文本是否属于同一个模版,从而不存在一个固定阀值应用所有文本模版;本发明是对文本字符集的完整比较,先比较字符集大小与再比较文本字符的顺序,所以该发明准确率高;本发明适用于所有通过模版生成的文本的去重功能。

著录项

  • 公开/公告号CN110688831A

    专利类型发明专利

  • 公开/公告日2020-01-14

    原文格式PDF

  • 申请/专利权人 上海创蓝文化传播有限公司;

    申请/专利号CN201910949281.8

  • 发明设计人 元方;林渠策;唐小波;宋争光;

    申请日2019-10-08

  • 分类号G06F40/186(20200101);G06F16/903(20190101);

  • 代理机构51241 成都方圆聿联专利代理事务所(普通合伙);

  • 代理人胡文莉

  • 地址 201613 上海市松江区中创路68号19幢

  • 入库时间 2023-12-17 06:21:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-11

    实质审查的生效 IPC(主分类):G06F40/186 申请日:20191008

    实质审查的生效

  • 2020-01-14

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号