首页> 中国专利> 用于对网页数据进行分类的分类模型的训练方法及装置

用于对网页数据进行分类的分类模型的训练方法及装置

摘要

本发明公开了一种对网页数据进行分类的分类模型的训练方法及装置,包括:从网页中对应不同路径的网页数据中获取训练样本数据,所述训练样本数据包括网页数据的网页内容和路径信息;获取关于所述训练样本数据的真实分类结果的分类标签;至少基于网页内容和路径信息来生成所述训练样本数据的特征;基于由所述训练样本数据的特征以及训练样本数据的分类标签组成的训练样本,通过预设机器学习算法,训练用于对网页数据进行分类的分类模型。本发明用于在网页数据进行分类时的分类模型的训练过程。

著录项

  • 公开/公告号CN112131445A

    专利类型发明专利

  • 公开/公告日2020-12-25

    原文格式PDF

  • 申请/专利权人 第四范式(北京)技术有限公司;

    申请/专利号CN201910548164.0

  • 发明设计人 胡单;陈伟;

    申请日2019-06-24

  • 分类号G06F16/906(20190101);G06K9/62(20060101);

  • 代理机构11348 北京鼎佳达知识产权代理事务所(普通合伙);

  • 代理人刘铁生;孟阿妮

  • 地址 100085 北京市海淀区上地东路35号颐泉汇大厦写字楼A座610室

  • 入库时间 2023-06-19 09:18:22

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号