首页> 外国专利> OPTIMIZING GRADIENT BOOSTING FEATURE SELECTION

OPTIMIZING GRADIENT BOOSTING FEATURE SELECTION

机译:优化渐变升压功能选择

摘要

Gradient Boosting Decision Tree (GBDT) successively stacks many decision trees which at each step try to fix the residual errors from the previous steps. The final score produced by the GBDT is the sum of the individual scores obtained by the decision trees for an input vector. Overfitting in GBDT can be reduced by removing the input values that have the least impact on the output from the training data. One way to determine which input variable has the lowest predictive value is to determine the input variable that is used for the first time in the latest decision tree in the GBDT. This method of identifying the low-predictive features to be removed does not require that earlier trees be regenerated to generate the new GBDT. Since the removed feature was already not used in the earlier trees, those trees already ignore the removed feature.
机译:渐变升压决策树(GBDT)连续堆叠许多决策树,在每个步骤中尝试从先前步骤中修复残余错误。 由GBDT产生的最终得分是输入向量的决策树获得的各个分数的总和。 通过删除对从训练数据的输出影响最小的输入值,可以减少GBDT中的过度装箱。 确定哪个输入变量具有最低预测值的方法是确定在GBDT中最新决策树中第一次使用的输入变量。 这种识别要删除的低预测功能的方法不要求再生以生成新的GBDT。 由于删除的功能已在早期的树中已未使用,因此这些树已经忽略了删除的功能。

著录项

  • 公开/公告号EP3901839A1

    专利类型

  • 公开/公告日2021-10-27

    原文格式PDF

  • 申请/专利权人 SAP SE;

    申请/专利号EP20200213358

  • 发明设计人 DOAN HUU JACQUES;

    申请日2020-12-11

  • 分类号G06N20/20;G06N5;

  • 国家 EP

  • 入库时间 2022-08-24 21:55:11

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号