XGBoost
XGBoost的相关文献在2017年到2023年内共计943篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术
等领域,其中期刊论文569篇、会议论文1篇、专利文献373篇;相关期刊355种,包括计算机工程与应用、计算机科学、计算机系统应用等;
相关会议1种,包括第三届数字版权管理创新发展论坛等;XGBoost的相关文献由3266位作者贡献,包括葛志强、宋冠先、彭浩等。
XGBoost
-研究学者
- 葛志强
- 宋冠先
- 彭浩
- 朱孟龙
- 梁铭
- 秦川
- 解威威
- 郑建立
- 鞠平
- 马文安
- 刘广臣
- 周邦鸿
- 唐辉
- 宋博
- 张亚飞
- 张浩
- 徐蔚鸿
- 李登峰
- 李茜
- 杨康
- 林鹏程
- 王琳
- 钟华
- 马必聪
- 万安平
- 万定生
- 于霞
- 余宇峰
- 刘凯
- 刘晓燕
- 刘波
- 刘飞
- 史清江
- 吴鑫
- 孔宪光
- 孙伟
- 孙涛
- 孟丹
- 宋传洲
- 宫思艺
- 岳东
- 常建涛
- 康俊锋
- 张丽娜
- 张伟
- 张磊
- 张阳
- 张鹏
- 徐亮
- 曹渝昆
-
-
游国鹏;
王健清;
刘飞;
袁强;
柳皓严;
吴瑛
-
-
摘要:
背景:筛选关键动作技术指标用以指导专项训练或比赛是提升比赛成绩的关键。男、女运动员动作技术差异明显,男、女运动员的关键动作技术指标尚未可知。目的:筛选影响速度攀岩精英运动员比赛成绩的关键动作技术指标,为速度攀岩的科学训练提供方向与理论支撑。方法:选用2017-2021年间攀岩世锦赛、世界杯和中攀联赛中速度攀岩决赛视频,获取男、女前4名运动员的比赛样本(男子:109个,女子:117个),运用二维运动学分析法,采集运动员的反应时、触点特征和分段速度指标,分别建立男子与女子速度攀岩精英运动员的随机森林和XGBoost回归模型,计算各动作技术指标对比赛成绩影响力。结果与结论:①男子精英运动员的随机森林和XGBoost模型的均方根误差分别为0.224与0.265,r2分别0.765与0.686;关键动作技术指标为:左手触点时间总和、右手动作频率、右手触点时间总和、3-6号点速度、左脚动作频率、右脚触点时间总和、11-13号点速度、13-18号点速度、8-10号点速度、左脚触点时间总和、左手触点个数和右脚动作频率;②女子精英运动员的随机森林和XGBoost模型的均方根误差分别为0.066与0.055,r2分别为0.846与0.887;关键动作技术指标为:左手触点时间总和、右手触点时间总和、右手动作频率、左脚动作频率、左脚触点时间总和、8-10号点速度、右脚触点时间总和、10-11号点速度和13-18号点速度;③速度攀岩比赛上肢动作技术指标(触点时间总和与动作频率)的影响力高于下肢动作技术指标,触点个数对比赛成绩影响力不高,男子与女子精英运动员首要制胜段落分别为3-6与8-11号点段落。运动员应重点优化首要制胜段落的上肢触点时间,带动优化下肢触点时间指标,提升比赛成绩。
-
-
武梦婷;
陈秋松;
齐冲冲
-
-
摘要:
为了更加快捷、高效地判定边坡稳定与否,基于机器学习,融合主成分分析法(PCA)、参数调整、影响因素权重分析等,建立了一种边坡安全稳定性评价体系.研究发现,运用PCA可以在保留80%数据原信息的前提下将输入变量维度从六维降至三维,但此时模型效果有所下降;随机森林及梯度提升(XGBoost)两种学习算法均可搭建有效的边坡安全稳定性评估模型,通过对其预测效果的对比分析,确定XGBoost为最佳评价模型.与此同时,采取卡方检验、F检验以及互信息法3种相关性检验手段,并通过计算评价因子的重要程度且加以可视化展示,明确了容重、坡高、内摩擦角以及内聚力4个内在因素的重要性,最终将评估结果与实际结合提出了边坡安全防护措施.
-
-
刘维功;
王昊展;
时振堂;
黎德初;
胡学良;
李劲松
-
-
摘要:
局部放电模式识别对交联聚乙烯(XLPE)电缆绝缘性能的判定具有重要意义。在XLPE电缆的局部放电模式识别的研究中,传统机器学习算法存在收敛速度慢、易过拟合、识别准确率低等问题。文章采用一种基于改进XGBoost算法的XLPE电缆局部放电模式识别方法。通过搭建电缆局部放电试验平台人为构造四种35 kV XLPE电缆局部放电缺陷模型进而获取原始数据,利用MATLAB软件完成统计特征参数的计算,以特征参数为输入量,放电类型预测结果为输出量,通过交叉验证、学习曲线确定最优参数进而得到有效的模式识别模型。实验分析结果表明,与决策树、随机森林、BP神经网络和SVM等局部放电模式识别方法相比,文中方法可进一步提升识别准确率,总体识别准确率为96.93%。
-
-
王延安;
刘庆芳;
成卫
-
-
摘要:
为了进一步加强道路交通安全管理,提升道路交通安全预警系统的准确度,提出一种基于XGBoost算法的道路交通事故严重程度预测模型。首先利用SMOTE对不平衡数据集进行处理,使正负样本数量达到1∶1;然后利用随机森林算法将影响城市道路交通事故严重程度的特征进行重要性排序,找出对预测模型影响较大的因素;最后基于XGBoost算法构建预测模型,使用网格搜索法进行模型参数寻优,提高预测准确度。通过与KNN、Logistic及随机森林3种模型进行结果对比分析发现,XGBoost模型的分类准确率平均提升0.097。基于XGBoost算法的道路交通事故严重程度预测模型拥有更加优越的预测性能,可为预防和降低交通事故严重程度提供可靠参考。
-
-
王稼春;
彭姜深;
朱莉
-
-
摘要:
本文使用德国零售数据,经过观察数据的特征,展开数据预处理,建立特征工程;通过将聚类分析与XGBoost模型相结合,建立混合预测模型对德国零售业数据进行建模预测。该模型首先对特征集降维之后选择最优的聚类数,然后对聚类分析后不同的类别分别进行XGBoost模型训练,最后将通过加权求和得到预测结果。研究结果表明,相比较于其他模型,混合模型提升了预测精度和泛化能力。
-
-
邢强;
张晋言;
王镇方;
马睿;
姜文宗;
刘宝弟;
王延江
-
-
摘要:
传统的测井解释规则库的获取需专业研究人员以手工方式进行,存在繁琐、耗时等缺点,且技术熟练程度直接影响到解释评价效果,为此,提出了一种基于XGBoost的测井解释规则库自动获取或建立测井解释专家规则库的方法,将多种物理信息和地质参数作为输入特征,储层类别作为输出标签,通过引入XGBoost算法,经过学习得出地质参数与储层类别之间的关系模型。利用该模型,可以自动预测储层类别,进而建立测井解释规则库。胜利油田盐家永安地区某砂砾岩油气藏的砂砾岩测井解释评价结果表明,与支持向量机(SVM)算法和梯度提升决策树(GBDT)算法相比,本文方法具有更高的准确率和更高的计算效率。研究区老井复查结果表明:与手工获取规则库方法相比,本文方法较完整地提取了研究区内的知识规则,提升了测井解释的准确率。
-
-
马婷婷
-
-
摘要:
为减轻大气污染给人类带来的危害,国内外的学者在上个世纪就开始研究空气预报模型,高效且准确性高的预测模型可以预测未来若干天的大气污染情况,人们可以据此做出有效的应对措施以减少大气污染带来的危害。目前常用WRF-CMAQ模拟体系对空气质量进行预报,但由于受到各种不确定因素的影响,WRF-CMAQ预报模型的结果并不理想。本文主要工作是在WRF-CMAQ预报模型的基础上二次建模,提出了两个模型分别为WRF-CMAQ-BP和WRF-CMAQ-XGBoost模型,在构建网络后进行测试,在调参过程中发现WRF-CMAQ-BP模型的效果是更优的,因此本文用WRF-CMAQ-BP模型预测六种常规污染物的单日浓度值。
-
-
牛淇
-
-
摘要:
药物研发过程中,通过筛选影响显著的化合物继而合成抗癌药物无疑能够保证抗癌药物研发的高效性和针对性。本文针对收集到的与乳腺癌相关的ER?活性的1974种化合物,首先利用基于遗传算法的随机森林模型筛选出前20个对生物活性最具有显著影响的分子描述符,其次以此选择分子描述符变量构建定量预测模型得到预测结果,随后构建化合物的分类预测模型。结果表明该模型预测具有很强的实践意义,采用的预测策略是有效的,可为抗乳腺癌药物的研发提供借鉴。
-
-
任敏捷;
靳国庆;
王晓雯;
陈睿东;
袁运新;
聂为之;
刘安安
-
-
摘要:
随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用。现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向。本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测。本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果。
-
-
乔楠;
李振兴;
赵国生
-
-
摘要:
针对物联网入侵检测中检测数据不平衡导致的分类不准确的问题,提出了一种基于极端梯度提升树和随机森林相结合的物联网入侵检测模型.首先,针对物联网应用环境中产生的大量数据,对数据进行数据归一化处理.然后,利用XGBoost算法对其中的特征进行重要性评分,选择最优特征.最后,结合改进的随机森林算法,解决因数据不平衡导致的分类不准确的问题.仿真试验表明所提模型能有效的进行数据最优特征选择及合理地检测分类,同RF算法、SVM算法、Tree-SVM模型和RF-GDBT模型相比,所提模型的检测准确率有效改善.