首页> 外国专利> Dropout for Ensemble Machine Learning Classifiers

Dropout for Ensemble Machine Learning Classifiers

机译:集成机器学习分类器的辍学

摘要

Machine learning often uses ensemble classifiers, such as random forest or gradient boosting tree classifiers to solve problems. One issue with such classifiers is that they may be prone to data overfitting. This can cause the classifier to perform relatively worse when dealing with data outside of a training set. One technique to avoiding overfitting is using random dropout on decision trees in the ensemble classifier (e.g. drop three percent of all decision trees to create a final classifier). However, random dropout can be improved upon. Penalty based dropout can assess the performance of individual trees using a validation data set (which may be separate from the training set). Instead of using random dropout, some of the worst performing trees can be dropped instead, leading to better overall performance.
机译:机器学习通常使用集成分类器(例如随机森林或梯度增强树分类器)来解决问题。这种分类器的一个问题是它们可能容易出现数据过度拟合的情况。这可能会导致分类器在处理训练集之外的数据时表现相对较差。避免过度拟合的一种技术是在整体分类器中对决策树使用随机丢弃(例如,丢弃所有决策树的百分之三以创建最终分类器)。但是,可以改善随机丢失。基于惩罚的辍学可以使用验证数据集(可以与训练集分开)评估单个树的性能。可以使用一些性能最差的树来代替使用随机丢弃,而是丢弃一些树,从而提高整体性能。

著录项

  • 公开/公告号US2020311614A1

    专利类型

  • 公开/公告日2020-10-01

    原文格式PDF

  • 申请/专利权人 PAYPAL INC.;

    申请/专利号US201916370553

  • 发明设计人 LICHAO LIU;ZHANGHAO HU;

    申请日2019-03-29

  • 分类号G06N20/20;G06Q20/40;

  • 国家 US

  • 入库时间 2022-08-21 11:22:27

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号