首页> 中文学位 >基于多标签分类的传感网数据异常检测方法研究
【6h】

基于多标签分类的传感网数据异常检测方法研究

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1论文的研究背景

1.2无线传感器网络

1.3国内外相关研究现状

1.4论文的研究内容

1.5论文的研究对实际应用的意义

1.6论文的组织

2 基于多标签分类的数据异常检测模型

2.1研究基础

2.2多标签分类模型概述

2.3无线传感器网络数据异常概述

2.4数据异常检测建模

2.5实验分析

2.6本章小结

3 基于信息熵和集成方法的特征评价

3.1研究基础

3.2信息增益

3.3基于信息熵的集成特征选择算法

3.4实验分析

3.5本章小结

4 基于多标签ReliefF的特征子集评价

4.1研究基础

4.2 ReliefF特征选择算法

4.3基于多标签ReliefF的特征选择算法

4.4实验分析

4.5本章小结

5 基于相关近似熵的特征生成

5.1研究基础

5.2连续型相关信息熵

5.3模糊近似熵

5.4相关近似熵

5.5实验分析

5.6本章小结

6 基于相关信息熵的分类算法

6.1研究基础

6.2离散型相关信息熵

6.3基于相关信息熵的数据异常分类算法

6.4实验分析

6.5本章小结

7 总结与展望

7.1本文研究工作总结

7.2研究展望

参考文献

致谢

攻读博士学位期间发表的学术论文和参加科研情况

声明

展开▼

摘要

无线传感器网络已经广泛地应用于多个领域,其资源受限特性使得它无法从软件和硬件上保证自身具有较强的抗干扰能力。然而,无线传感网络通常部署在环境比较恶劣的野外环境中,这使得无线传感器网络所采集的数据很容易发生错误,称为数据异常。针对实际无线传感器网络的多项研究表明:传感器数据的不可靠性广泛存在,保证传感器数据质量是一个亟需解决的重要问题。为了得到高质量的数据,研究无线传感器网络中的数据异常检测技术具有重要意义。针对传统的学习框架无法处理多种数据异常同时出现的问题,研究了基于多标签分类的无线传感器网络数据异常检测技术,主要创新点和贡献如下:
  (1)提出了一种基于多标签分类的数据异常检测建模方法。针对传统的学习框架在描述无线传感器网络中多种数据异常同时出现时会出现歧义的问题,提出了一种基于多标签分类的数据异常检测建模方法。无线传感器网络所采集的传感器数据是连续的数据流,而多标签分类模型需要使用多个实例来描述传感器的数据信息,为此数据异常检测建模方法给出了建立数据异常检测模型的过程,包括数据流的分割、数据特征生成、数据异常标签的标记和数据异常的检测过程。实验结果表明,基于多标签分类的数据异常检测模型在无线传感器网络数据异常检测中是一种有效方案。
  (2)提出了一种基于信息熵和集成方法的特征选择方法EMFSIE。由于无线传感器网络中所采集的数据包含了噪声和多种干扰信息,因此想要获得能够准确地描述不同数据异常类型的数据特征并不是一件容易的事情,通常所生成的特征集合中包含了噪声、冗余和不相关的特征,会严重影响数据异常检测模型的性能,为此提出一种基于信息熵和集成方法的特征选择方法,去除冗余和不相关的特征。该方法采用特征与标签集合之间的信息增益值来度量特征与标签集合之间的相关程度;考虑到多种数据异常同时出现使得不同数据异常类型之间出现语义交叉的问题,引入了集成方法的思想,通过聚类将具有相似语义的实例放在一起对特征进行评估,从而减少语义交叉对特征评估结果所带来的负面影响。实验结果表明,所提出的特征选择方法不仅能够显著提升数据异常检测模型的性能,并且能够显著地缩短数据异常检测模型的训练时间。
  (3)提出了一种基于多标签RelefF的特征选择方法MLRFS。EMFSIE方法适用于处理离散型数据,在处理连续型数据前需要对数据进行离散化预处理,并且该算法无法直接给出所要选择的特征子集,为此提出了一种基于多标签ReliefF的特征选择方法。首先对ReliefF在原始特征空间中搜索的最近邻实例无法准确对特征进行评估的原因进行了分析;接着MLRFS方法在降维后的特征子集空间中搜索最近邻实例,并在这些实例上对特征子集进行评估;为了给出一个合理的特征子集,MLRFS采用前向搜索的启发式方法搜索特征子集。
  (4)提出了基于相关近似熵的特征生成方法。特征选择是一个NP-hard问题,虽然EMFSIE和MLRFS方法可以显著改善数据异常检测模型的性能,但它们无法找到最优的特征子集。为此,基于相关近似熵的特征生成方法从特征生成的角度研究改善数据异常检测模型的性能,解决模糊近似熵在计算传感器数据特征时计算复杂度较大和依赖的参数过多的问题。相关近似熵方法采用相关信息熵来计算向量空间中多维数据之间的相关度,通过计算向量空间在其维数由M维增加到M+1维时多维数据之间保持相关性的概率来判定一个时间序列的复杂程度。相对于模糊近似熵,相关近似熵方法将依赖参数从4个减少到了2个,并减小了计算复杂度。
  (5)提出了一种基于相关信息熵的数据异常检测方法。该方法从多种数据异常标签之间的相关关系角度研究改善数据异常检测模型的性能,采用相关信息熵对不同数据异常标签之间的相关关系进行度量。首先依据数据异常标签之间相关关系的强弱次序找出多个互不相交的数据异常标签组合,然后使用LP分类器对这些数据异常标签组合构成的数据集进行训练和预测,最后对这些预测结果进行融合后得到最终的预测结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号