首页> 中文学位 >数据挖掘技术在配电网报警信息处理中的应用
【6h】

数据挖掘技术在配电网报警信息处理中的应用

代理获取

目录

封面

中文摘要

英文摘要

目录

Contents

第1章 绪 论

1.1 课题的研究背景

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文的组织结构

第2章 数据挖掘技术及其在电力系统中的应用

2.1 数据挖掘简介

2.2 数据挖掘的任务及步骤

2.3 数据挖掘中常用的算法和技术

2.4电力系统中的数据挖掘

2.5配电网报警信息处理中的数据挖掘

2.6 本章小结

第3章 决策树分类算法研究

3.1 分类概述

3.2 决策树算法原理

3.3 ID3算法

3.4 C4.5算法分析

3.5 其他决策树分类算法分析

3.6 几种决策树算法对比

3.7 本章小结

第4章 决策树算法的改进

4.1 对ID3算法简化改进

4.2 对原ID3算法属性偏向性的改进

4.3对改进前后的ID3算法进行实例验证

4.4 在MATLAB下用ID3算法实现决策树的构造

4.5 算法仿真及验证

4.6 本章小结

第5章 决策树算法构造配电网报警信息分类器

5.1 报警信息数据预处理

5.2 报警信息主要归纳关系的形成

5.3 用决策树算法构造报警信息噪声处理的分类器

5.4 本章小结

总结与展望

参考文献

附 录

攻读学位期间发表的学术论文目录

致谢

展开▼

摘要

在配电网调度自动化系统中,报警系统信息量巨大,其中往往含有大量的噪声信息。传统的报警系统只是单纯地上传告警信息,未经处理且快速变化的海量报警信息容易造成调度员忽略真正重要的报警信息,延时处理故障,危害电网安全。
  针对以上问题,本文将数据挖掘技术引入到配电网报警信息的噪声处理中,应用改进后的ID3算法构造对配电网中的报警信息进行噪声过滤的分类器。该分类器可以将报警信息分为噪声信息和非噪声信息两类,很好的解决了报警信息不加识别的上传给调度人员的缺点。本文所做的工作主要如下:
  (1)深入研究了数据挖掘技术,重点对数据挖掘中的决策树算法进行了详细探讨;概括总结了ID3算法、C4.5算法、CART算法、SLIQ算法及SPRINT算法的特点及优缺点。
  (2)本文探讨了经典的ID3算法的两个突出缺点:运算复杂和在选择属性时偏向于取值较多的属性,并对这两个方面进行改进。ID3算法是以信息熵理论为基础构建决策树的,每次在选择分裂属性时都要对其进行多次对数运算,在数据量较多的时候,运算速度明显变慢,本文针对这一问题,提出了相应的简化方法;再则,ID3应用信息增益作为最佳属性的选择标准,这样就会导致该算法偏向于选择取值较多的属性,而有时候取值较多的属性并不是最优属性,针对这一问题,本文引入一乘积因子到简化后的信息熵中,来克服ID3算法的取值的偏向性。
  (3)本文通过实例分析对改进后的ID3算法的优越性进行实验验证,并实现了用MATLAB语言来构造决策树。
  (4)本文在研究配电网中报警信息特点的基础上,实现了配电网中的报警信息的预处理及主要归纳关系的形成,只有对形式复杂的报警信息进行预处理并且得到主要归纳关系后才可以将它们用于数据挖掘任务中。
  (5)用改进后的ID3决策树算法设计了用于配电网报警信息中噪声识别的分类器。该分类器可以从报警信息中识别出噪声信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号