首页> 中国专利> 文本中不良文字信息的过滤方法及过滤系统

文本中不良文字信息的过滤方法及过滤系统

摘要

本发明涉及文本处理技术领域,具体涉及文本中不良文字信息的过滤方法及过滤系统。该过滤方法包括:步骤1,提取待过滤文本;步骤2,利用词典中词条长度动态确定最大匹配算法中词长Maxlen的值,通过Mexlen对待过滤文本进行分词;步骤3,循环判断分词后的每个词汇是否为敏感词汇,如果是敏感词汇,采用非敏感词汇替换敏感词汇后,输出替换敏感词汇后的文本。本发明解决了分词过程中MaxLen初始值不变所带来的长词被切分错误和时间长、效率低的问题。随后对分词后的词串进行敏感判断,并根据判断结果输出文本。由于采用了改进的分词方式,因此提高了整体过滤速度和过滤准确度。

著录项

  • 公开/公告号CN105468584A

    专利类型发明专利

  • 公开/公告日2016-04-06

    原文格式PDF

  • 申请/专利权人 武汉鸿瑞达信息技术有限公司;

    申请/专利号CN201511027950.4

  • 发明设计人 高玉环;喻西香;朱山;朱光喜;

    申请日2015-12-31

  • 分类号G06F17/27;

  • 代理机构北京汇信合知识产权代理有限公司;

  • 代理人夏静洁

  • 地址 430000 湖北省武汉市东湖新技术开发区光谷大道35号银久科技产业园一期4幢3层3号

  • 入库时间 2023-12-18 15:24:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-06

    发明专利申请公布后的驳回 IPC(主分类):G06F17/27 申请公布日:20160406 申请日:20151231

    发明专利申请公布后的驳回

  • 2016-05-04

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20151231

    实质审查的生效

  • 2016-04-06

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号