首页> 中国专利> 一种违法网站识别方法、装置、设备及存储介质

一种违法网站识别方法、装置、设备及存储介质

摘要

本申请公开了一种违法网站识别方法、装置、设备及存储介质。该方法包括:获取网站数据;通过语义识别从所述网站数据中筛选出包含违法文本内容的目标网站,并对所述目标网站的网页进行截图操作以得到待识别图片;通过图像识别确定所述待识别图片对应的目标网站的网站类型;所述网站类型包括黑产网站和被篡改的门户网站。通过语义识别粗略筛选出存在风险的目标网站,然后再通过图像识别从存在风险的目标网站中精确的判读出黑产网站,结合语义的文本粗略筛选和图像的精准筛选,可以快速准确的从海量的互联网数据中识别出黑产网站。

著录项

  • 公开/公告号CN113688346A

    专利类型发明专利

  • 公开/公告日2021-11-23

    原文格式PDF

  • 申请/专利权人 杭州安恒信息技术股份有限公司;

    申请/专利号CN202110937883.9

  • 发明设计人 虞天;范渊;黄进;

    申请日2021-08-16

  • 分类号G06F16/958(20190101);G06F21/55(20130101);G06F40/30(20200101);G06K9/32(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人丁曼曼

  • 地址 310000 浙江省杭州市滨江区西兴街道联慧街188号

  • 入库时间 2023-06-19 13:21:35

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号