声明
摘要
第1章 绪论
1.1 课题背景及研究意义
1.2 电力设备监测数据存储和数据处理的研究现状
1.2.1 监测系统的存储软件和监测平台架构
1.2.2 时序波形信号监测数据的存储方法
1.2.3 电力设备监测数据的并行分析和快速处理
1.3 本文的研究内容和结构安排
第2章 云计算与大数据处理技术
2.1 云计算与大数据
2.1.1 云计算的概念和特点
2.1.2 大数据的概念和特点
2.1.3 云计算与大数据的关系
2.2 Hadoop大数据处理技术
2.2.1 Hadoop分布式文件系统HDFS
2.2.2 分布式数据处理MapReduce
2.2.3 分布式面向列的数据库HBase
2.2.4 Hadoop的适用场景
2.3 大数据计算服务ODPS
2.4 Spark大数据处理技术
2.5 本章小结
第3章 电力设备监测大数据存储方法研究
3.1 引言
3.2 电力设备监测大数据的特点
3.3 基于HDFS的数据存储方法研究
3.3.1 存储架构设计
3.3.2 多源监测数据在分布式系统中的数据分布策略
3.3.3 考虑数据相关性的多副本一致性哈希存储算法
3.3.4 影响HDFS存储性能的其他因素及优化方法
3.3.5 Hadoop平台搭建和HDFS性能基准测试
3.4 基于HBase的数据存储方法研究
3.4.1 电力设备波形信号数据的HBase存储设计
3.4.2 考虑时空二维属性的监测数据HBase存储设计
3.4.3 基于YCSB的HBase存储性能测试
3.5 基于ODPS的数据存储方法研究
3.5.1 自建Hadoop存储系统的局限性
3.5.2 变压器局部放电数据的ODPS表存储方法
3.5.3 PD数据上传与压缩存储性能测试
3.6 本章小结
第4章 基于MapReduce的电力设备监测大数据并行分析及其应用研究
4.1 引言
4.2 并行化总体经验模态分解算法MR-EEMD及去噪应用
4.2.1 时序波形信号的快速处理
4.2.2 EEMD算法性能分析
4.2.3 自适应数据分段及边界补偿处理
4.2.4 并行化EEMD算法MR-EEMD
4.2.5 实验结果与分析
4.2.6 基于MR-EEMD的局部放电信号去噪
4.3 多源数据并行关联分析
4.3.1 数据分布对并行算法性能的影响
4.3.2 多源监测数据并行关联查询算法
4.3.3 并行化多通道数据融合特征提取
4.3.4 实验结果与分析
4.4 并行化分形维数特征提取与密度聚类划分
4.4.1 电力设备波形信号的时频分形维数
4.4.2 基于分形维数特征的半监督DBSCAN聚类划分算法
4.4.3 实验结果与分析
4.5 基于ODPS并行框架MR2的局部放电相位分析和模式识别
4.5.1 大数据环境下传统局部放电相位分析的局限性
4.5.2 并行化PD信号分析整体流程
4.5.3 数据预处理和数据上传
4.5.4 PD信号放电基本参数n-q-φ并行提取算法
4.5.5 谱图构造和统计特征计算
4.5.6 并行化KNN局部放电类型识别
4.5.7 实验结果与分析
4.6 本章小结
第5章 基于Spark的电力设备监测大数据并行分析
5.1 引言
5.2 监测数据在RDD中的分布式存储
5.3 Spark-KNN快速模式识别算法
5.3.1 基于Spark的并行化KNN算法Spark-KNN
5.3.2 Spark-KNN算法的RDD数据处理流程
5.3.3 基于Hadoop MapReduce的并行化KNN算法MR-KNN
5.4 实验与结果分析
5.4.1 实验环境搭建
5.4.2 实验数据
5.4.3 Spark-KNN性能测试
5.5 本章小结
第6章 结论与展望
6.1 结论
6.2 展望
参考文献
攻读博士学位期间发表的论文及其它成果
攻读博士学位期间参加的科研工作
致谢
作者简介