首页> 中文学位 >基于相似性分析的时间序列异常检测研究
【6h】

基于相似性分析的时间序列异常检测研究

代理获取

摘要

随着经济的高速发展和科技的不断进步,人们对各类信息的关注和依赖也日趋增加,如何充分有效地管理和利用这些海量数据、发现这些数据背后隐含的规律和知识,就成为研究者非常关注的问题。作为数据挖掘的重要研究课题之一,时间序列的数据挖掘与预测近几年发展迅速,它将数据挖掘和时间序列联系起来,支持解决发现型问题,以从海量的时间序列数据中挖掘出有价值的、潜在的、未知的知识为目的。本文以时间序列数据的异常检测为主题,分别研究了时间序列的模式表示方法、时间序列的相似性度量、时间序列的异常检测等问题。以下是本文的主要研究工作和成果:
   (1)基于重要点探测技术的时间序列线性分段算法能较好的保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。本文对该方法进行改进,通过重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在在固定分段数的情况下反映时间序列的主要特征,算法简单快速,整体拟合误差小。
   (2)提出了一种基于PLR表示的时间序列动态平移模式距离(DynamicTranslationPatternDistance,DTPD)。该方法由单模式距离(SinglePatternDistance,SPD)和全模式距离(FullPatternDistance,FPD)两部分组成。单模式距离(SPD)用于比较一个单独模式之间的相似度,而全模式距离(FPD)用于比较模式组之间的相似度,也就是整条时间序列之间的相似度。全模式距离(FPD)采用了和时间序列动态弯曲距离(DTW)相似的动态弯曲思路,将单模式距离(SPD)整合为全模式距离(FPD),并以此作为候选序列之间的相似量度。实验证明,使用该方法对实验数据集进行聚类准确、高效。
   (3)通过对基于k-近邻局部密度的异常检测LOF方法经行研究,将LOF方法改进后引入时间序列的异常检测中,提出一种基于局部密度的时间序列模式异常检测方法(LocalOutlierFactorBasedOnPattern,PLOF),该方法利用时间序列的PLR表示对原始时间序列降维,并使用时间序列单模式距离(SinglePatternDistance,SPD)对序列模式进行相似性量度,从而大大减少了原算法运算时间,而且过滤了噪声,从整体上把握了时间序列数据的“异常”模式。实验证明,该方法可准确检测出时间序列异常模式。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号