首页> 中文学位 >朴素贝叶斯分类算法在降雨预测中的研究与应用
【6h】

朴素贝叶斯分类算法在降雨预测中的研究与应用

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 气象数据挖掘的研究现状

1.2.2 朴素贝叶斯算法的研究现状

1.2.3 离散化算法的研究现状

1.3 研究内容

1.4 论文的结构

2.1 数据挖掘

2.1.1 数据挖掘的定义

2.1.2 数据挖掘的过程

2.2 气象数据

2.2.1 气象数据的特点

2.2.2 气象数据预处理

2.2.3 常用的气象数据挖掘方法

2.3 朴素贝叶斯分类算法

2.3.1 贝叶斯分类相关理论

2.3.2 贝叶斯分类算法

2.3.3 朴素贝叶斯分类模型

2.4 数据离散化

2.4.1 离散化的概念

2.4.2 离散化的评价标准

2.5 本章小结

第三章 基于类别属性关联离散算法的改进朴素贝叶斯分类模型

3.1.1 CAIM算法

3.1.2 CAIR与CAIU标准

3.1.3 CAID算法

3.2 基于类别属性关联离散算法的朴素贝叶斯分类模型

3.2.1 降雨预测因子的选择

3.2.2 基于CAID的朴素贝叶斯分类算法

3.3 实验与分析

3.3.1 实验环境与数据

3.3.2 实验结果分析

3.4 本章小结

第四章 基于属性加权的改进朴素贝叶斯分类算法

4.1 信息论基础

4.1.1 熵和条件熵

4.1.2 互信息与条件互信息

4.2 改进加权的朴素贝叶斯分类模型

4.2.1 改进的属性赋权方法

4.2.2 加权朴素贝叶斯降雨等级预测模型

4.3 实验与结果分析

4.3.1 实验环境与数据

4.3.2 实验结果分析

4.3.3 本章小结

第五章 总结与展望

5.1 工作总结

5.2 未来展望

致谢

参考文献

作者简介

展开▼

摘要

随着社会的不断进步和发展,各行各业都与气象预报有着密切的关系,特别是对一些灾害性天气的准确预报尤为重要。与此同时科技的快速发展以及气象观测技术的不断进步,积累了海量的气象数据,其中蕴藏着大量气象规律,如何从气象数据中获得有价值的信息成为一项重要的研究内容。 本文主要研究朴素贝叶斯分类算法(Naive Bayesian Classification,NBC)对降雨等级分类预测的问题,指出了离散化对朴素贝叶斯分类算法的有效性和属性赋权对朴素贝叶斯分类算法的重要性,从预测因子的属性值离散化和朴素贝叶斯分类算法假设属性之间相互条件独立两个方面,来改进朴素贝叶斯分类算法。通过分析样本气象数据,选择出降雨预测因子,然后建立改进的朴素贝叶斯分类模型,完成对降雨等级的分类预测。本论文主要研究以下内容: 针对气象数据集中降雨类分布的不平衡性和连续数值型属性的离散化问题,提出了改进的类-属性关联离散化算法(Class-Attribute Interdependency Discretization,CAID)。通过分析类与属性的二维量化矩阵后,充分考虑了气象数据在属性中的分布情况,同时结合了不同的离散标准,提出了改进的离散化准则CAID,然后基于该准则设计实现了CAID算法。该算法从候选断点集中选择出最佳的断点,把属性域分割成若干区间,在信息损失最少的情况下得到更加合理的离散化方案,并提高了少数降雨类的识别率,更加有利于后续模型的学习。然后在CAID算法离散后的真实气象数据上构建一种基于CAID算法的朴素贝叶斯分类模型(D-NBC),实现对降雨等级的分类预测。通过分析对比实验结果,验证了本文提出的算法可以更好的解决气象数据中连续数值型属性的离散化问题,相比较其它算法在后续的分类预测中有更好的性能提升。 针对朴素贝叶斯分类算法假设属性之间相互条件独立的问题,为了提高朴素贝叶斯分类算法的分类精度,提出一种基于属性加权的改进朴素贝叶斯分类算法(INBC),该算法使用互信息与条件互信息综合确定每个属性的权值,以此来削弱属性之间相互条件独立的假设,然后在CAID算法离散后的真实气象数据下,构建基于属性加权的朴素贝叶斯降雨等级预测模型。对比分析实验结果表明,本文提出的加权朴素贝叶斯分类模型具有更好的分类性能,在一定程度上提高了朴素贝叶斯模型对降雨等级分类预测的精度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号