首页> 中国专利> 基于TAN树形朴素贝叶斯算法网页可点击识别方法及装置

基于TAN树形朴素贝叶斯算法网页可点击识别方法及装置

摘要

本发明公开了基于TAN树形朴素贝叶斯算法网页可点击识别方法及系统,该方法包括:包括:步骤S10,操控浏览器获取目标源网页,爬取该网页的数据,并根据获取到的数据构造出标签节点树;步骤S20,根据朴素贝叶斯方法,计算出该标签节点树每一个节点特征在可点击与不可点击类别下的条件概率;步骤S30,根据每个节点可点击的条件概率,计算出每一个对父子节点在可点击与不可点击类别下的条件互信息值,并作为边的权重;步骤S40,根据权重,判断出拥有较高可点击概率的节点,并点击该节点。本发明所涉及的数据爬取以及点击等具体行为不需要人工参与定义,减少人工干预。加入人工智能辅助,爬取过程人工介入量少,训练好的模型可适应大多数目标源,重用性高。

著录项

  • 公开/公告号CN108388645B

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 智言科技(深圳)有限公司;

    申请/专利号CN201810162571.3

  • 发明设计人 周柳阳;张南迪;许皓天;

    申请日2018-02-27

  • 分类号G06F16/951(20190101);G06N7/00(20060101);

  • 代理机构44384 深圳市中科创为专利代理有限公司;

  • 代理人梁炎芳

  • 地址 518000 广东省深圳市宝安区新安街道创业二路139号新一代信息技术产业园C座318

  • 入库时间 2022-08-23 12:22:11

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号