首页> 中文学位 >面向数据流的异常检测技术研究
【6h】

面向数据流的异常检测技术研究

代理获取

目录

声明

摘要

第一章绪论

1.1论文研究背景及意义

1.2研究现状

1.2.1入侵检测相关研究现状

1.2.2数据流挖掘相关研究现状

1.3论文组织架构

第二章数据流相关问题

2.1数据流相关概念

2.1.1数据流的定义

2.1.2数据流的特征

2.1.3数据流聚类

2.1.4数据流分类

2.1.5数据流的应用环境

2.2数据流与数据集挖掘算法的区别和联系

2.2.1数据流与数据集挖掘算法的区别

2.2.2数据流与数据集挖掘算法的联系

2.3数据流挖掘常用工具

2.3.1数据挖掘工具Weka

2.3.2数据流挖掘工具MOA

2.4本章小结

第三章基于数据流聚类的异常检测模型

3.1数据流聚类的特点

3.2异常检测模型设计

3.2.1微簇结构设计

3.2.2在线聚类模块设计

3.2.3离线检测模块设计

3.2.4异常检测算法设计

3.3实验验证

3.3.1在线模块测试

3.3.2离线模块测试

3.4本章小结

第四章基于不精确概率的异常检测算法

4.1数据流分类算法Hoeffding Tree

4.2不精确概率异常检测算法

4.2.1 Credal集合与Dempster-Shafer证据理论

4.2.2概率区间与不精确狄利克雷模型

4.2.3信息增益与不精确信息增益

4.2.4改进的异常检测算法

4.3实验验证

4.3.1不精确信息增益效果测试

4.3.2改进的异常检测算法测试

4.4本章小结

5.1工作总结

5.2展望

致谢

参考文献

作者简介

展开▼

摘要

网络空间安全始终是研究者关注的重点,尤其是在网络设备升级,宽带提速的今天,如何在复杂的网络数据流下,有效地发现异常数据是当前安全领域的主要问题之一。传统的面向静态数据集的数据挖掘算法首先将数据集全部加载到内存,通过对数据集的多次遍历以建立静态的分析模型,这个过程需要大量的时间和空间开销。数据流具有数据分布动态变化、数据体积潜在无穷、数据持续到达等特征。这些特征要求数据流挖掘算法能够在有限的内存下通过单次遍历数据建立初始模型,且该模型能够及时地对后续到达的数据做出相应处理,动态调整以适应变化的数据流。 现有的异常检测技术大多基于传统的数据挖掘算法,虽然能够在静态的数据集上获得较好的结果,但是无法应用于动态的数据流环境。基于上述分析和比较,本文针对数据流环境下的异常检测技术进行相应研究,并做出如下工作: (1)本文阐述了数据流的概念和定义,分析了动态数据流环境对挖掘算法的要求和存在的问题,总结了数据流挖掘的主要任务和常用算法。数据流是一个由连续的数据对象构成的序列,这些数据通常持续到达,具有高维特征,潜在的数据分布存在变化。相较于传统机器学习技术,数据流挖掘算法通常只记录数据粗略的统计信息,单次访问数据,并增量式更新模型。 (2)本文结合数据流聚类的特点和异常检测任务的需要,提出了基于数据流聚类的异常检测模型。数据流聚类只能够动态发现数据的分布状态,而不能实现对数据的异常检测。本文提出的异常检测模型受数据流聚类启发,由在线聚类模块和离线检测模块两个部分组成。在线聚类模块能够提取和记录数据的概要统计信息,解决了数据体积增长带来的存储问题,动态调整微簇结构以适应数据分布的变化。离线检测模块根据在线模块维持的聚类信息,使用相似性或差异性度量方法,实现了对异常数据的实时检测。 (3)本文通过分析不精确概率对决策树分裂属性选择的影响,结合已有的Hoeffding Tree算法,提出了一种基于不精确概率的异常检测算法。该算法引入不精确狄利克雷模型,计算Credal集合的最大熵值,从而估算在无穷样本时,分裂属性所产生的真正熵值变化。改进后的算法能够选择最佳属性进行分裂,并及时停止冗余子树生长,避免了模型的过拟合。该算法能够有效降低节点数量,保持Hoeffding Tree算法的分类效果,进而获得较高的异常检测准确率。同时,该算法数据处理速度较快,也能够满足高速数据流环境下异常检测任务的需要。

著录项

  • 作者

    章荪;

  • 作者单位

    南京信息工程大学;

  • 授予单位 南京信息工程大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 尹春勇;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    数据流;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号