首页> 中文期刊>计算机技术与发展 >利用衍生特征预测新冠疫情的随机森林方法

利用衍生特征预测新冠疫情的随机森林方法

     

摘要

新冠疫情爆发以来,许多研究运用时滞动力学模型、传播动力学模型和机器学习模型对疫情进行分析,取得了一定的效果。然而由于不同国家和地区之间发展差异较大,数据不均衡,导致算法普适性较弱。随机森林(Random Forest)是一种基于决策树或回归树的集成学习模型,由多个Bagging集成学习技术训练得到的决策树或回归树投票来获得最终的结果。在分析数据集特性的基础上,该文将原本难以体现样本差异性的特征值进行变换和组合,衍生出新的特征值,并且根据新增特征值将原有数据进行分组。采用随机森林构建疫情预测模型,对各个分组数据集分别进行训练和预测。在随机森林模型中的实验表明,该方法能够有效提高新冠疫情预测准确率,对原本差异显著地区具备更好的适应性,同时很好地防止机器学习过拟合,能较好容忍噪声值和离群值,也给未来类似传染性疾病的预测提供了新的思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号