首页> 外国专利> Method, system and computer-readable storage medium for detecting trap of web-based perpetual calendar and building retrieval database using the same

Method, system and computer-readable storage medium for detecting trap of web-based perpetual calendar and building retrieval database using the same

机译:用于检测基于网络的万年历陷阱并使用该方法建立检索数据库的方法,系统和计算机可读存储介质

摘要

The present disclosure relates to a method, system and software executable by a processor associated with non-transitory computer-readable storage medium for detecting a trap of web-based calendar pages and building a retrieval database. According to an aspect of the disclosure, detecting a trap of web-based calendar pages includes clustering, by a clustering module, URLs corresponding to web pages stored in a database according to a predetermined standard, generating a regular expression by analyzing a date pattern included in a clustering result, and detecting, a cluster suspected of being a trap of web-based perpetual calendar pages using the generated regular expression.
机译:本公开涉及与非暂时性计算机可读存储介质相关联的处理器可执行的方法,系统和软件,用于检测基于网络的日历页面的陷阱并建立检索数据库。根据本公开的一方面,检测基于网络的日历页面的陷阱包括:通过集群模块对与根据预定标准的数据库中存储的网页相对应的URL进行集群,通过分析包括的日期模式来生成正则表达式。在聚类结果中,并使用生成的正则表达式检测怀疑是基于Web的永久日历页面陷阱的聚类。

著录项

  • 公开/公告号US9141697B2

    专利类型

  • 公开/公告日2015-09-22

    原文格式PDF

  • 申请/专利权人 DONG YUN SIM;CHAEHYUN LEE;

    申请/专利号US201113152017

  • 发明设计人 CHAEHYUN LEE;DONG YUN SIM;

    申请日2011-06-02

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 15:20:41

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号