首页> 中文学位 >决策树分类算法在农作物病虫害诊断系统中的研究与应用
【6h】

决策树分类算法在农作物病虫害诊断系统中的研究与应用

代理获取

目录

1.1选题背景

1.2研究目的和意义

1.3国内外研究现状

1.4本文的工作

1.5本文的主要创新点

2.1数据挖掘概述

2.2农业数据挖掘概述

2.3农业数据挖掘的过程

2.4农业数据挖掘的关键技术

2.5农业数据挖掘的发展方向

2.6本章小结

3.1决策树分类技术概述

3.1.1数据分类的定义

3.1.2决策树分类的定义

3.2决策树分类算法的主要研究内容

3.2.1数据预处理

3.2.2特征选择策略

3.2.3决策树剪枝策略

3.2.4决策树性能评价

3.3几种典型的决策树算法

3.3.1ID3算法

3.3.2C4.5算法

3.3.3SLIQ算法

3.2.4决策树分类算法分析比较

3.4Boosting技术

3.5本章小结

4.1算法的设计思路

4.2基于C4.5算法实现的改进策略

4.2.1对空缺值的处理

4.2.2对连续属性离散化过程的优化

4.3诊断算法设计

4.4实验与结果分析

4.3.1算法正确性分析

4.3.2算法优化性验证

4.5本章小结

5.1背景及功能

5.2体系结构

5.2设计流程

5.2.1诊断模型生成流程

5.2.2诊断流程

5.3系统评价

5.3.1本系统的优点

5.3.2本系统有待改进的方面

5.4本章小结

6.1总结

6.2展望

主要参考文献

展开▼

摘要

农作物是人类生产和生活所必需的资源,农作物的产量和质量直接影响到人类的生活,而病虫害是农作物生产过程中的重要制约因素。由于受全球气候变暖、生态环境恶化等因素影响,农作物病虫害发生频率越来越高。虽然我国是一个农业大国,但是农业科技人员相当缺乏,并且分布不均,这与我国的国情很不相符。因此,对农作物病虫害的诊断研究具有重要的理论和应用价值,利用先进的计算机技术结合农作物病虫害信息数据库,研发病虫害诊断系统已经成为一个重要的发展方向。
  本文利用农作物病虫害的特征数据库结合数据挖掘技术建立农作物病虫害诊断模型。在研究数据挖掘中决策树技术的基础上,对常用的C4.5算法进行了改进,并引入了Boosting集成技术,充分考虑诊断模型的优化性、稳定性和准确度,提出了基于改进C4.5算法和Boosting集成技术的诊断算法。该方法分为三个阶段:第一阶段是采用相似性原理对空缺值进行填充,减少空缺值对建立分类模型的影响;第二阶段是采用基于改进C4.5算法的Boosting集成方法建立多个分类模型;第三阶段是用训练出的模型对新样本的类别进行加权投票表决。本文的实验是在多个标准的数据集上进行的,结果表明:改进的C4.5算法比原C4.5算法的效率高,诊断算法的诊断结果准确度有了很大的提高。最后,将设计的诊断算法应用到大豆的病虫害诊断系统中,取得了良好的应用效果。
  本文工作的主要创新点有如下几点:
  (1)在数据处理阶段,采用相似性原理对空缺值进行填充,替换掉原C4.5算法中调整信息增益的方法,这样使样本集更合理;
  (2)改进C4.5算法中对连续属性离散化的处理过程,使处理过程更优化;
  (3)在构建诊断模型时,将决策树算法和Boosting集成技术结合起来,提出了一种基于改进C4.5决策树技术和Boosting集成技术的农作物病虫害诊断算法,较好地保证了模型的泛化能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号