XGBoost算法
XGBoost算法的相关文献在2016年到2022年内共计247篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术
等领域,其中期刊论文161篇、会议论文3篇、专利文献51789篇;相关期刊135种,包括中国数字医学、仪器仪表与分析监测、电测与仪表等;
相关会议3种,包括上海制冷学会2017年学术年会、第33次全国计算机安全学术交流会、香港中医学会、教育研究基金会2017国际针灸高峰论坛等;XGBoost算法的相关文献由950位作者贡献,包括刘广臣、张晨宇、李军等。
XGBoost算法—发文量
专利文献>
论文:51789篇
占比:99.68%
总计:51953篇
XGBoost算法
-研究学者
- 刘广臣
- 张晨宇
- 李军
- 王志宁
- 王慧芳
- 于滨
- 任继红
- 任进
- 倪艺洋
- 党钰洁
- 冯思玲
- 冯文龙
- 冷述文
- 刘博
- 刘小壮
- 刘林
- 刘重党
- 卢婷婷
- 吕伟韬
- 吕干云
- 周宁
- 周建新
- 孙丹
- 孙叶钧
- 孙昊
- 孙涛
- 孙雁飞
- 孟莎莎
- 崔子超
- 崔逊龙
- 张东冉
- 张丰收
- 张威
- 张晖
- 张林宣
- 张玉琼
- 张红伟
- 张超
- 张雨
- 张鹏辉
- 徐韧
- 戚晓东
- 施炜利
- 朱洪波
- 李敏
- 李纯柱
- 李茂
- 杨俊杰
- 杨宝清
- 杨晨
-
-
李双悦
-
-
摘要:
财务风险大小直接影响投资者以及债权人的利益,识别公司财务风险状况有利于及时掌握企业运营情况,有利于整个资本市场健康有序发展。基于此,选取连续两年内因为财务问题被列为ST公司和与之相类似的正常公司总共162家公司为样本,采用财务分析方法,选取包含反映企业偿债能力、营运能力、盈利能力和增长能力在内的22个财务指标,运用机器学习中的XGBoost算法判断企业财务风险状况。XGBoost算法对企业是否具有财务风险的识别准确率较高,最高可达94.45%。
-
-
鲁涔
-
-
摘要:
用户属性是刻画用户的基础。常见用户属性指标包括:用户的性别、年龄、入网时间、在网状态、省份城市、活跃地等等。然而由于各种山寨、刷机、刷rom的存在以及手机实际使用人不是购机人等,部分数据存在异常或缺失,特别是人口学属性。而性别又是人类差异最大的特征之一,是群体行为、偏好和需求等方面的基本影响因子之一,性别识别的重要性和价值性不言而喻,用户画像产品的构建,基本存在性别标签的识别需求。这部分数据可以通过XGBoost数据挖掘的方法来预测。针对传统男女识别方法效率低等问题,对于互联网用户行为特征,应用梯度增强集成分类器XGBoost算法进行特征选择,建立分类模型识别男女性别,实践表明该方法对于海量用户的真实使用性别的识别准确率可达73%。
-
-
田晟;
甘志恒;
吕清
-
-
摘要:
提高剩余续驶里程预测精度可以缓解驾驶人的“续航焦虑”,帮助车厂开发精细的电池管理系统,提高纯电动汽车的接受度。基于改进符号回归算法自动生成与标签字段高度相关的新数据特征字段,实现数据维度扩充。再将维度扩充后的数据传入经过超参数调优的XGBoost模型预测剩余续驶里程。对比仅使用经典特征字段的原始数据,维度扩充后的数据在预测精度上最大相对绝对误差下降4.9%,平均绝对误差和均方根误差下降超过20%,且随着时间的增加,使用维度扩充后的数据进行预测的误差下降更快。结果证明提出的方法可以优化数据集质量,提高预测结果的精确度并减小误差,为纯电动汽车剩余续驶里程预测提供了新的思路。
-
-
陈紫儿;
王洋;
柳瑞春;
李雨泰;
尚智婕
-
-
摘要:
由于传统方法对流量特征的提取效果不佳,导致流量特征识别效率低,研究基于XGBoost算法的HTTPS流量识别方法。通过采集流量数据样本,对6个应用的数据流量样本进行处理和分析。提取HTTPS流量特征,组成流量特征序列。获取HTTPS数据域名,建立二级域名信息库。构建XGBoost算法识别模型,识别流量样本类型。经实验论证分析,设计方法可以识别正确域名和新域名,流量识别效果较好。经实验论证分析,流量长度及个数特征与蓄力特征能够有效的保证识别的准确率。对异常加密流量识别结果进行分析,文中方法能够有效解决异常流量数据集的不平衡现象,查准率具有明显的提升,且准确率在98%以上。经过识别效果评估与对比分析,文中方法与传统方法相比,能够在较短时间内完成流量识别,说明该文方法识别效率更高。
-
-
丁峤;
刘俊延;
刘林云;
杨璐铭
-
-
摘要:
域名系统(Domain Name System,DNS)隧道是一种典型的网络隐蔽通道,攻击者窃取的信息被编码并封装到DNS报文中进行传输。在攻击者具备受控服务器和受控域的前提下,只要被攻击者的网络需要进行域名解析服务,DNS隧道就可以实现,IDS也不会因此触发警报。目前流行的基于载荷和基于流量的检测方法都不够灵活,且误报率高。为了更有效地识别DNS隧道攻击,对DNS报文特征进行分析,提取出5大类共15个特征标记一条完整的DNS会话,选用XGboost分类模型进行分类识别。实验结果表明,实验选用的15个特征可以有效检测DNS隧道流量,对于4种不同隧道软件产生的隧道流量识别率达95%。在此基础上,对所选特征的重要性进行了评估,成功筛选出能够保持分类模型稳定性下的最小特征子集。
-
-
门元昊;
吴亮;
刘晓双;
秦枭喃;
罗森林
-
-
摘要:
基于物理模型及列车性能参数的地铁列车运行状态仿真方法存在着列车适配性差、参数调整成本高等问题。为了给ATC(列车自动控制)系统的研究提供更为准确、高效的模拟试验平台,提出一种基于XGBoost(极端梯度提升)算法的列车运行状态仿真模型构建方法。该方法可从实际运行数据中学习列车的控制与运行特性,可针对不同的线路环境、不同列车车型实现更准确的列车运行状态仿真。在某地铁线路采用实车进行试验,结果表明:该方法建立的列车运行状态仿真模型准确、有效,可满足实际应用需求。
-
-
叶黎明;
施式亮;
鲁义;
李贺;
曾明圣
-
-
摘要:
为准确预测我国煤矿安全态势,本文提出一种基于差分自回归移动平均(ARIMA)模型和极端梯度爬升(XGBoost)算法的煤矿安全态势预测方法,该方法使用ARIMA模型对表征煤矿安全态势的3项重要指标(包括煤矿事故死亡人数、煤矿百万吨死亡率与瓦斯事故死亡人数)的历史数据进行时间序列建模,在分析单一ARIMA模型的预测结果后,使用XGBoost算法对上述3项指标的残差序列进行预测;最后,由XGBoost算法的残差预测值修正ARIMA模型预测值。结果表明:该混合模型对3项指标的预测精度均优于单一ARIMA模型,并运用此方法对2021年我国煤矿事故死亡人数、百万吨死亡率与瓦斯事故死亡人数进行预测和分析,预测方法与结果可为煤矿生产和监管部门的安全决策提供依据。
-
-
程诗尧;
武赫;
李雪城;
易欣;
李乾
-
-
摘要:
为提高库存资产管理水平,以某省级电网公司各县级库房为例,分析库房管理风险和资产管理风险。本文首先利用电能表资产档案数据,梳理识别特征,然后利用XGBoost算法构建异常资产识别模型,模型能准确识别出异常的电能表,异常电能表的查准率为90.8%,查全率为71.8%。通过分析发现正常和异常电能表在表龄、第一次运行时长、状态持续时长和合格在库持续时长这四个特征上有较大差别。最后,从电能表、周转柜和计量点三个维度入手,构建库房风险层次指标体系,使用组合赋权评价库房管理风险,风险评价结果与异常资产预测基本一致,相关性达74.5%。本文研究可促进库房盘点的精准化,推进库房管理和绩效考核建设,提升库存管理的智能化水平。
-
-
王雍;
侯慧娟;
姚琼琼
-
-
摘要:
文中提出了一种运行中智能电能表质量分析及预测方法研究的方法。该方法以电能表关键环节相关数据为基础,选取电能表在研发设计、物料采购、生产制造、验收检测、安装运行、拆回报废环节数据作为模型构建的样本数据,利用XGBoost算法分类方法建立智能电能表质量分析模型。以国网河南省电力公司的拆回电能表数据为例,对智能电能表各类质量问题开展建模分析及预测,并进行现场验证,再根据验证结果持续优化模型。结果表明,该方法精确率达到0.73,能够较为客观地反应智能电能表关键环节质量情况。
-
-
董涛;
段淼;
车晓萍;
孙友凯
-
-
摘要:
采集石油勘探应用软件模块运行时的资源消耗信息,包括不同模块对服务器资源占用情况的数据。根据需求采集相关数据,包括CPU、内存、网络、临时盘等。在勘探开发云平台运行应用软件资源需求已知模块的作业,采集资源消耗数据。根据所采集数据的模块资源需求特点,对数据进行标注,使用极限梯度提升(extreme gradient boosting,XGBoost)算法,建立模型并训练。采集资源需求未知模块作业运行时的资源消耗数据,根据之前建立的模型确定此模块的资源需求类型。使用资源调度算法,以将资源需求互补的虚拟机部署到相同的物理节点为目标,计算虚拟机部署位置,通过虚拟机迁移实现计算资源优化分配。
-
-
徐廷喜;
吴斌;
黄小清;
杜志敏;
晋欣桥
- 《上海制冷学会2017年学术年会》
| 2017年
-
摘要:
空调系统制冷剂泄漏故障常用诊断方法是利用经验规则进行判断,论文首先利用经验规则表挑选机器学习特征,然后分别利用xgboost算法和随机森林算法训练诊断模型,并对比两种算法模型精度以及模型的泛化能力.两种算法模型的测试精度均达99%以上,且模型泛化误差均小于0.01,克服了常规机器学习模型过拟合的问题,并能够区分不同程度故障,有利于进一步指导研究多种故障类型问题.
-
-
-
-
-
-
ZHANG Yang;
张阳;
YA Yuangang;
姚原岗
- 《第33次全国计算机安全学术交流会》
-
摘要:
机器学习在网络入侵检测中的应用已经受到各界广泛关注,应用的算法主要是决策树、随机森林、logit、KNN等机器学习模型,这些算法发布时间较长、应用成熟、发掘潜力有限.Xgboost算法推出时间相对较晚,在网络入侵检测中的研究较少.文章以此为研究对象,基于入侵检测数据集KDD99,使用logit、KNN、决策树、随机森林、Xgboost等机器学习模型分别进行5折交叉验证,计算和比较这些算法的识别效果.试验结果表明,同已有的机器学习算法相比,Xgboost算法在各种入侵检测中均有优异的表现,算法在网络入侵检测领域有较大的发展空间.
-
-
ZHANG Yang;
张阳;
YA Yuangang;
姚原岗
- 《第33次全国计算机安全学术交流会》
-
摘要:
机器学习在网络入侵检测中的应用已经受到各界广泛关注,应用的算法主要是决策树、随机森林、logit、KNN等机器学习模型,这些算法发布时间较长、应用成熟、发掘潜力有限.Xgboost算法推出时间相对较晚,在网络入侵检测中的研究较少.文章以此为研究对象,基于入侵检测数据集KDD99,使用logit、KNN、决策树、随机森林、Xgboost等机器学习模型分别进行5折交叉验证,计算和比较这些算法的识别效果.试验结果表明,同已有的机器学习算法相比,Xgboost算法在各种入侵检测中均有优异的表现,算法在网络入侵检测领域有较大的发展空间.
-
-
ZHANG Yang;
张阳;
YA Yuangang;
姚原岗
- 《第33次全国计算机安全学术交流会》
-
摘要:
机器学习在网络入侵检测中的应用已经受到各界广泛关注,应用的算法主要是决策树、随机森林、logit、KNN等机器学习模型,这些算法发布时间较长、应用成熟、发掘潜力有限.Xgboost算法推出时间相对较晚,在网络入侵检测中的研究较少.文章以此为研究对象,基于入侵检测数据集KDD99,使用logit、KNN、决策树、随机森林、Xgboost等机器学习模型分别进行5折交叉验证,计算和比较这些算法的识别效果.试验结果表明,同已有的机器学习算法相比,Xgboost算法在各种入侵检测中均有优异的表现,算法在网络入侵检测领域有较大的发展空间.
-
-
ZHANG Yang;
张阳;
YA Yuangang;
姚原岗
- 《第33次全国计算机安全学术交流会》
-
摘要:
机器学习在网络入侵检测中的应用已经受到各界广泛关注,应用的算法主要是决策树、随机森林、logit、KNN等机器学习模型,这些算法发布时间较长、应用成熟、发掘潜力有限.Xgboost算法推出时间相对较晚,在网络入侵检测中的研究较少.文章以此为研究对象,基于入侵检测数据集KDD99,使用logit、KNN、决策树、随机森林、Xgboost等机器学习模型分别进行5折交叉验证,计算和比较这些算法的识别效果.试验结果表明,同已有的机器学习算法相比,Xgboost算法在各种入侵检测中均有优异的表现,算法在网络入侵检测领域有较大的发展空间.