首页> 中文期刊>中国环境监测 >湖南空气质量预报中的数据预处理和特征工程

湖南空气质量预报中的数据预处理和特征工程

     

摘要

为提高空气质量预报的准确率,建立了融合气象和环境观测资料、结合机器学习和数值天气预报,且预测时效较长、预测精度较高的机器学习模型库。以湖南6个城市(长沙、株洲、湘潭、益阳、常德、岳阳)的空气质量预报为例,将数据预处理、特征工程方法运用到模型之中,得出以下几点结论:①数据预处理工作包括样本收集、数据清洗、缺失值处理、异常值剔除等,对提高模型预测稳定性帮助很大。②点、线、面的特征组合有助于完整地描述污染物的生消过程。引入传输指数后,株洲市模型对传输型污染过程的预测性能得到明显提高,对轻度、中度、重度污染的分类准确度分别提升了23.6%、16.6%、30.0%。引入静稳指数后,长沙市模型PM_(2.5)浓度测试的相关系数由0.938提升至0.959,均方根误差由10.33下降至8.46,且模型对中度以上污染天气的极值预报结果更接近实况;益阳市模型在高浓度样本预测中存在的系统性偏低现象得到改善,对轻度以上污染天气的预报结果得到较大矫正。③随机森林的特征重要性排序功能可以大幅度减少特征的数量,使得模型的可解释性和稳定性增强。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号