首页> 中文期刊>农业机械学报 >农业机械作业大数据清洗方法与试验优化

农业机械作业大数据清洗方法与试验优化

     

摘要

针对农业机械大数据平台中,已有数据清洗算法不适用于大规模、多源异构、高维度和强时空相关实时数据的问题,分析了复杂田间环境下农机作业数据异常来源及特征,研究了异常数据检测及修正技术,提出一种基于滑动窗口机制的农机作业数据在线清洗方法.该方法基于方差约束原则识别异常数据,基于最小变动原则生成候选修正数据,基于数据时间相关性通过AR、ARX模型迭代优化得到最终修复值,依托Flink分布式计算平台,从而适应农机数据吞吐量大、并发度高的特点.基于某省农机作业数据对算法进行了有效性验证,结果表明,在数据规模达到1×105条、数据异常率为5%的情况下,算法异常识别率达到0.94,且与已有清洗算法相比均方根误差更小.基于Box-Behnken方法设计试验,通过响应面分析得到回归模型,分析算法参数对均方根误差和运行时间的影响.基于二进制编码的混合遗传算法对参数进行优化,优化后的参数组合可使算法均方根误差达到0.16、运行时间达到0.13s.该数据清洗方法能够为农机大数据平台的实时处理提供高质量数据支撑.

著录项

  • 来源
    《农业机械学报》|2021年第6期|35-42|共8页
  • 作者单位

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

    中国农业机械化科学研究院土壤植物机器系统技术国家重点实验室 北京100083;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 农业电气化与自动化;信息处理(信息加工);
  • 关键词

    农业机械; 大数据; 数据清洗;

  • 入库时间 2023-07-24 21:53:40

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号