基于梯度分布调节策略的Xgboost算法优化

李浩; 朱焱

首页> 中文期刊>计算机应用 >基于梯度分布调节策略的Xgboost算法优化

基于梯度分布调节策略的Xgboost算法优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决集成学习模型Xgboost在二分类问题中少数类检出率低的问题,提出了基于梯度分布调节策略的改进的Xgboost算法--LCGHA-Xgboost。首先,通过定义损失贡献(LC)来模拟Xgboost算法中样本个体的损失量;而后,通过定义损失贡献密度(LCD)来衡量Xgboost算法中样本被正确分类的难易程度;最后,提出了梯度分布调节算法LCGHA,依据LCD动态调整样本个体的一阶梯度分布,间接地增大难分样本(主要存在于少数类中)的损失量,减小易分样本(主要存在于多数类中)的损失量,使Xgboost算法偏向对难分样本的学习。实验结果表明,与Xgboost、GBDT、随机森林(Random_Forest)这三大集成学习算法相比,LCGHA-Xgboost算法在多个UCI数据集上的召回率(Recall)值有5.4%~16.7%的提高,AUC值有0.94%~7.41%的提高;在垃圾网页数据集WebSpam-UK2007和DC2010数据集上所提算法的Recall值更是有44.4%~383.3%的提高,AUC值有5.8%~35.6%的提高。LCGHA-Xgboost算法可以有效提高对少数类的分类检出能力,减小少数类的分类错误率。

著录项

来源
《计算机应用》|2020年第6期|1633-1637|共5页
作者
李浩; 朱焱;
展开▼
作者单位

西南交通大学信息科学与技术学院成都611756;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
不平衡分类; Xgboost; 梯度分布; 损失贡献; 损失贡献密度;
入库时间 2022-08-18 22:18:20

相似文献

中文文献
外文文献
专利

1. 基于遗传算法优化XGBoost的油浸式变压器故障诊断方法 [J] . 张又文 ,冯斌 ,陈页 . 电力自动化设备 . 2021,第002期
2. 基于随机搜索算法优化XGBoost的过热汽温预测模型 [J] . 马良玉 ,於世磊 ,赵尚羽 . 华北电力大学学报(自然科学版) . 2021,第004期
3. 基于接地网状态评估技术对场区地表电位梯度分布测试方法的分析 [J] . 余炜 ,沈映 ,余云光 . 电工技术 . 2021,第013期
4. 基于FAREAST模型的青海云杉中-幼龄林生物量碳沿海拔梯度分布特征 [J] . 王清涛 ,赵传燕 ,王小平 . 干旱区地理 . 2020,第5期
5. 基于对比度和梯度分布的红外弱小目标检测 [J] . 王露 ,刘明娜 ,杨杰 . 上海航天 . 2019,第005期
6. 基于稀疏取样和梯度分布特征的车标识别 [C] . Zhou Binbin ,周斌斌 ,Gao Shangbing . 2017中国仿真大会 . 2017
7. 基于XGBoost算法优化的因子选股模型 [A] . 董鹤 . 2018

基于梯度分布调节策略的Xgboost算法优化

摘要

著录项

相似文献

相关主题

期刊订阅