基于多标签分类的传感网数据异常检测方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

无线传感器网络已经广泛地应用于多个领域，其资源受限特性使得它无法从软件和硬件上保证自身具有较强的抗干扰能力。然而，无线传感网络通常部署在环境比较恶劣的野外环境中，这使得无线传感器网络所采集的数据很容易发生错误，称为数据异常。针对实际无线传感器网络的多项研究表明：传感器数据的不可靠性广泛存在，保证传感器数据质量是一个亟需解决的重要问题。为了得到高质量的数据，研究无线传感器网络中的数据异常检测技术具有重要意义。针对传统的学习框架无法处理多种数据异常同时出现的问题，研究了基于多标签分类的无线传感器网络数据异常检测技术，主要创新点和贡献如下：
　　（1）提出了一种基于多标签分类的数据异常检测建模方法。针对传统的学习框架在描述无线传感器网络中多种数据异常同时出现时会出现歧义的问题，提出了一种基于多标签分类的数据异常检测建模方法。无线传感器网络所采集的传感器数据是连续的数据流，而多标签分类模型需要使用多个实例来描述传感器的数据信息，为此数据异常检测建模方法给出了建立数据异常检测模型的过程，包括数据流的分割、数据特征生成、数据异常标签的标记和数据异常的检测过程。实验结果表明，基于多标签分类的数据异常检测模型在无线传感器网络数据异常检测中是一种有效方案。
　　（2）提出了一种基于信息熵和集成方法的特征选择方法EMFSIE。由于无线传感器网络中所采集的数据包含了噪声和多种干扰信息，因此想要获得能够准确地描述不同数据异常类型的数据特征并不是一件容易的事情，通常所生成的特征集合中包含了噪声、冗余和不相关的特征，会严重影响数据异常检测模型的性能，为此提出一种基于信息熵和集成方法的特征选择方法，去除冗余和不相关的特征。该方法采用特征与标签集合之间的信息增益值来度量特征与标签集合之间的相关程度；考虑到多种数据异常同时出现使得不同数据异常类型之间出现语义交叉的问题，引入了集成方法的思想，通过聚类将具有相似语义的实例放在一起对特征进行评估，从而减少语义交叉对特征评估结果所带来的负面影响。实验结果表明，所提出的特征选择方法不仅能够显著提升数据异常检测模型的性能，并且能够显著地缩短数据异常检测模型的训练时间。
　　（3）提出了一种基于多标签RelefF的特征选择方法MLRFS。EMFSIE方法适用于处理离散型数据，在处理连续型数据前需要对数据进行离散化预处理，并且该算法无法直接给出所要选择的特征子集，为此提出了一种基于多标签ReliefF的特征选择方法。首先对ReliefF在原始特征空间中搜索的最近邻实例无法准确对特征进行评估的原因进行了分析；接着MLRFS方法在降维后的特征子集空间中搜索最近邻实例，并在这些实例上对特征子集进行评估；为了给出一个合理的特征子集，MLRFS采用前向搜索的启发式方法搜索特征子集。
　　（4）提出了基于相关近似熵的特征生成方法。特征选择是一个NP-hard问题，虽然EMFSIE和MLRFS方法可以显著改善数据异常检测模型的性能，但它们无法找到最优的特征子集。为此，基于相关近似熵的特征生成方法从特征生成的角度研究改善数据异常检测模型的性能，解决模糊近似熵在计算传感器数据特征时计算复杂度较大和依赖的参数过多的问题。相关近似熵方法采用相关信息熵来计算向量空间中多维数据之间的相关度，通过计算向量空间在其维数由M维增加到M+1维时多维数据之间保持相关性的概率来判定一个时间序列的复杂程度。相对于模糊近似熵，相关近似熵方法将依赖参数从4个减少到了2个，并减小了计算复杂度。
　　（5）提出了一种基于相关信息熵的数据异常检测方法。该方法从多种数据异常标签之间的相关关系角度研究改善数据异常检测模型的性能，采用相关信息熵对不同数据异常标签之间的相关关系进行度量。首先依据数据异常标签之间相关关系的强弱次序找出多个互不相交的数据异常标签组合，然后使用LP分类器对这些数据异常标签组合构成的数据集进行训练和预测，最后对这些预测结果进行融合后得到最终的预测结果。

著录项

作者
张振海;
展开▼
作者单位

西北工业大学;

展开▼
授予单位西北工业大学;
学科计算机科学与技术
授予学位博士
导师姓名李士宁;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TN925.93;TP311.13;
关键词
无线传感器网络; 数据异常检测; 多标签分类; 相关近似熵; 特征选择;

相似文献

中文文献
外文文献
专利

1. 基于大数据技术的中文多标签文本分类方法研究 [J] . 孙桂煌 . 齐齐哈尔大学学报（自然科学版） . 2020,第006期
2. 基于深度学习的网络流量分类及异常检测方法研究 [J] . 王军峰 . 缔客世界 . 2019,第001期
3. 基于健壮主成分分类器的无监督异常检测方法研究 [J] . 邱文彬 ,吴渝 ,王国胤 . 计算机应用 . 2006,第004期
4. 基于支持向量数据描述的无标签数据多类分类 [J] . 朱帮助 ,林健 . 智能系统学报 . 2009,第002期
5. 基于大数据的异常检测方法研究 [J] . 杨先圣 ,姜磊 ,彭雄 . 计算机工程与科学 . 2018,第007期
6. 基于多标签分类的电能质量复合扰动分类方法研究 [C] . 管春 ,周雒维 . 第四届中国高校电力电子与电力传动学术年会 . 2010
7. 基于数据密度的带标签数据异常检测和分类方法研究 [A] . 高旭宁 . 2018

基于多标签分类的传感网数据异常检测方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅