您现在的位置: 首页> 研究主题> 随机森林模型

随机森林模型

随机森林模型的相关文献在2006年到2022年内共计310篇,主要集中在自动化技术、计算机技术、林业、农业基础科学 等领域,其中期刊论文209篇、会议论文5篇、专利文献174970篇;相关期刊174种,包括山地学报、灾害学、生态学报等; 相关会议5种,包括2011年中国卫生统计学年会、中国水力发电工程学会水电站运行管理专业委员会、中国水力发电工程学会梯级调度控制专业委员会2018年学术交流会 、香山科学会议第S42次学术会议等;随机森林模型的相关文献由1152位作者贡献,包括余坤勇、刘健、姚雄等。

随机森林模型—发文量

期刊论文>

论文:209 占比:0.12%

会议论文>

论文:5 占比:0.00%

专利文献>

论文:174970 占比:99.88%

总计:175184篇

随机森林模型—发文趋势图

随机森林模型

-研究学者

  • 余坤勇
  • 刘健
  • 姚雄
  • 邓念东
  • 任向辉
  • 余昊
  • 张平
  • 张红
  • 徐爱国
  • 王冰冰
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 陈郑望; 乐宁莉
    • 摘要: 为了有效地检测软件家族中的恶意软件,改进了加权随机森林模型,提出基于粒子群优化的随机森林(particle swarm optimization-random forest,PSO-RF)模型,并使用基于粒子群优化随机森林的恶意软件检测方法对恶意软件家族进行分类。对得出的结果与决策树、支持向量机等经典分类器从准确率、精确度、召回率、综合评价指标值(F;值)等指标进行对比分析,以验证改进后的算法的有效性与合理性。结果表明,PSO-RF模型评估指标均是最高的,能大大提升恶意软件的检测效果。
    • 赵竹君; 陆忠奇; 何清; 王建林
    • 摘要: 利用2009~2019年阿克达拉国家大气本底站CH_(4)浓度数据、气象要素数据,使用随机森林模型、后向轨迹模型聚类分析方法对其CH_(4)浓度变化特征和影响因素进行分析.结果表明,10a间阿克达拉站CH_(4)浓度增长明显,年平均浓度为(1934.30±30.94)×10^(−9),平均增长率0.45%;季节变化呈现秋冬高、春夏低的特征,冬季(1973.77±36.72)×10^(−9)>秋季(1935.86±36.14)×10^(−9)>春季(1922.36±26.38)×10^(−9)>夏季(1920.92±29.82)×10^(−9).阿克达拉站CH_(4)浓度受到气象因素综合影响,气温和相对湿度占主导作用.基于HYSPLIT模式和全球资料同化系统气象数据(GDAS)后向轨迹聚类分析发现,阿克达拉站气团移动的主要通道是与额尔齐斯河河谷平行,途径阿拉山口和老风口的西北路径,且秋冬季节气团移动速度慢、春夏快,可能影响了CH_(4)浓度季节变化.
    • 桑祎莹; 黄仕鑫; 易静; 曾庆
    • 摘要: 目的比较Logistic回归模型和随机森林模型诊断糖尿病周围神经病变(DPN)的效能。方法纳入2199例DPN患者作为病例组,2610例健康体检者作为对照组。收集19个实验室指标,包括超敏C反应蛋白、糖化血红蛋白、LDL、HDL、三酰甘油、总胆固醇、总胆红素、总蛋白、白蛋白、ALT、AST、碱性磷酸酶、γ-谷氨酰转肽酶、尿素、尿酸、血红蛋白、钙、钾、钠。使用SPSS 22.0软件构建诊断DPN的多因素Logistic回归模型,使用R 3.6.0软件构建诊断DPN的随机森林模型,采用受试者工作特征(ROC)曲线评价两种模型的诊断性能。结果Logistic回归模型和随机森林模型诊断DPN的正确率分别为81.4%、96.7%,灵敏度分别为72.5%、98.3%,特异度分别为89.2%、95.2%,ROC曲线下面积分别为0.882、0.963。结论随机森林模型对DPN的诊断效能优于Logistic回归模型,同时随机森林模型分析结果给出了各个变量指标的重要性评分,可为DPN的早期诊断提供重要的依据。
    • 王琴英; 王诗雨; 刘聪
    • 摘要: 文章从P2P网络借贷平台出现的风险事件出发,将问题平台的风险分类为平台运营风险、平台诈骗风险和平台信用风险。根据网上爬取的大样本数据,利用Relief F算法筛选平台风险来源的属性约简指标,统计分析平台风险的显著特征。通过设计随机森林模型,识别与预测三类平台风险;利用无序多分类Logit模型,估计三类风险发生的机会比。结果表明,风险平台具有预期收益率与借贷金额明显偏高,但资金来源不足,且借贷风险集中度较低的共同特征;提高平台流量、扩大前十大客户投资规模,能有效降低平台发生运营风险和诈骗风险的可能,而降低前十大借款人待还金额占比将减少平台信用风险的发生。
    • 任枫; 王琦; 杨佳; 任庆福
    • 摘要: 红光波段和近红外波段常被作为森林蓄积量反演的敏感波段,介于两者之间的红边波段往往被忽略,为了明确红边波段对森林蓄积量的遥感反演精度的影响,本研究基于高分六号卫星宽幅影像(GF6-WFV),结合西宁市2014年森林资源二类调查数据,从光谱特征、植被指数、地形因子、影像纹理等4个方面选取蓄积量反演的自变量,采用多元线性回归(MLR)、随机森林(RF)模型,分析比较了有无红边波段对西宁市针叶林蓄积量遥感反演精度的影响。结果表明:(1)无红边波段(No Red-Edge)和加入红边波段(Red-Edge Added)两组处理的纹理特征变量降维后,其主成分信息主要解释了红外、近红外以及红边1波段的纹理特征。(2)与蓄积量相关的光谱特征变量:No Red-Edge处理主要包括红边波段和近红外波段的地表反射率,Red-Edge Added处理主要为红边1波段的地表反射率;植被指数变量:No Red-Edge处理主要包括NDVI和SAVI,Red-Edge Added处理为MTCI。(3)加入红边波段后,RF模型的R^(2)优于MLR模型,分别为0.6719和0.5487,RF模型的均方根误差(RMSE)小于MLR模型,分别为26.3m^(3)×hm^(−2)和20.8m^(3)×hm^(−2)。(4)去除模型对反演精度的影响后,相对于No Red-Edge,Red-Edge Added处理的反演结果与观测值拟合的R^(2)提高了11.6%,RMSE降低了9.1%。说明加入红边波段可显著提高西宁市针叶林蓄积量的反演精度,研究结果可为森林蓄积量的遥感反演提供科学依据。
    • 胡义明; 陈腾; 罗序义; 唐超; 梁忠民
    • 摘要: 准确可靠的中长期径流预报是支撑水资源科学调配、提高水资源利用效率的关键。本研究采用AdaBoost模型(AdB)、随机森林模型(RF)和支持向量机模型(SVM)进行淮河流域王家坝和蚌埠站当年11月至次年10月共12个月的中长期径流预报研究。采用置换准确度重要性度量法从130项气象-气候因子及前期降雨/流量构建的1 562个因子变量中筛选出影响各月径流的关键因子,构建了基于AdB、RF和SVM模型的各月径流预报模型,模型参数采用随机搜索技术并结合交叉验证方式确定。采用变幅误差合格率和等级(五级)预报合格率指标对模型的预报精度进行了评估。变幅误差合格率指标表明,王家坝12个月的平均合格率分别为99.8%(AdB)、96.6%(RF)和95.9%(SVM),蚌埠站分别为100%(AdB)、94.8%(RF)和93.8%(SVM);等级预报合格率指标表明,王家坝12个月的平均合格率分别为79.0%(AdB)、76.4%(RF)和79.9%(SVM),蚌埠站分别为81.0%(AdB)、75.6%(RF)和76.6%(SVM)。模型均具有较好的预报效果,但RF和SVM模型对于高流量值的预报存在偏低现象,AdB模型整体上优于RF和SVM模型。
    • 王艺璇; 刘夏; 沈彦军
    • 摘要: 气候变化和人类活动是影响流域径流变化的两大因素,定量识别二者对流域径流的影响对水资源合理开发和流域综合治理具有重要意义。随机森林模型作为一种易于使用的机器学习方法,被越来越多地应用于水文学领域,然而随机森林模型在径流变化归因分析中是否具有适用性值得探讨。本文以永定河上游的洋河流域为例,基于随机森林模型对流域径流进行了模拟,采用径流影响评价模型定量分析了气候变化和人类活动对径流变化的贡献率;并利用基于物理机制的SWAT模型对研究结果进行了对比验证。研究结果表明:1)在对不同子流域径流模拟效果方面,SWAT分布式水文模型对东洋河(柴沟堡东站)、南洋河(柴沟堡南站)、洋河(响水堡站)流域突变前的径流量模拟结果较为可信,3个流域率定期和验证期的R^(2)均在0.65以上,纳什系数(NSE)也大部分在0.65以上;随机森林模型对3个流域模拟径流的NSE和R^(2)多在0.80以上,均高于SWAT模型的NSE和R^(2),随机森林模型模拟表现优于SWAT模型;2)对比验证发现,基于随机森林模型和SWAT模型的流域径流变化归因分析结果较为相近,人类活动是导致永定河上游流域径流变化的主要原因,对径流减少的贡献率为84.3%~97.6%。总体上,随机森林模型在永定河上游流域径流变化归因研究中具有一定的适用性,为流域径流变化贡献率的定量识别提供了一种新的方法和思路。
    • 罗瑞宁; 许立志
    • 摘要: 本文以 2015-2020 年 A 股上市公司为数据集,从公司偿债能力、经营能力、盈利能力、风险程度、股权特征五个维度选取相关指标代表公司财务状况特征,采用机器学习中的决策树模型和随机森林模型,根据机器学习模型特点,将模型分为数据预处理、分类器学习预测两个模块,进行财务风险预警研究,并使用第 T-1 年公司财务指标对第 T 年公司是否发生财务困境进行预测,以验证所使用的模型对于上市公司财务困境预警的有效性。
    • 李旭杰; 史灵; 花思洋; 孙颖; 黄凤辰
    • 摘要: 通过采集2020年6月至2021年6月南京市秦淮新河代表站的DO、WT、pH、COD、NH3-N、TUR 6类水质监测指标数据,利用Pearson相关系数对监测指标间的相关程度进行分析,从而得到各监测指标间的相关系数,进一步通过多元线性回归算法得到高度相关的参数指标间的统计关系,利用回归方程的形式表示监测变量间的因果关系,最后通过随机森林算法利用水质监测中的自变量指标实现对因变量指标的预测,达到减少监测项目从而降低监测成本的目的。研究结果表明因变量水质监测指标的预测值和实际值几乎重合,有效说明随机森林模型能够实现因变量水质监测指标的准确预测。
    • 钟艾妮; 答星; 喻静敏
    • 摘要: 随着国民生活水平的提高,人们对房价的关注度也持续升高。传统的房价研究主要按时间序列法进行预测,然而房价是多指标影响因子,除与历史房价、房屋自身属性有关外,还与所处区位的地理环境、配套设施以及城市的规划分区等多方面因素相关。本文以2019年深圳市二手住宅小区单价为研究对象,从地理视角下,选取教育资源、医疗设施、交通便捷度、环境因素、规划因素的相关指标作为房价影响因子,通过随机森林的方法进行样本训练得到深圳市房价研究模型,对影响深圳市房价的上述指标进行分析研究。根据随机森林模型输出的变量重要性得知,医疗设施对深圳市房价影响最为显著。将测试数据输入预测模型,当实际的房价在均值附近时,此模型预测效果较好。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号