首页> 中文学位 >多元时间序列数据挖掘相似性分析方法及应用研究
【6h】

多元时间序列数据挖掘相似性分析方法及应用研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 论文的组织结构

第二章 时间序列相似性分析相关关键技术

2.1 时间序列及相似性的相关概念

2.2 时间序列的模式表示方法

2.3 时间序列相似性度量方法

2.4 时间序列聚类

2.5 本章小结

第三章 基于MSN和WDTW的多元时间序列相似性度量方法

3.1 引言

3.2 分析框架

3.3 基于特征重要点分层检测的多元时间序列分段

3.4 基于分段矩阵范数的模式表示

3.5 基于加权动态时间弯曲的相似性度量

3.6 实验分析与评价

3.7 本章小结

第四章 基于CPCA和SWDTW的多元时间序列相似性度量方法

4.1 引言

4.2 分析框架

4.3 基于共同主成分分析的多元时间序列变换

4.4 基于局部特征改进的加权动态时间弯曲相似性度量

4.5 实验分析与评价

4.6 基于穿戴式医疗设备数据的实证研究

4.7 本章小结

第五章 基于K近邻网络的多元时间序列聚类算法

5.1 引言

5.2 分析框架

5.3 有向加权K-近邻网络模型构造

5.4 网络模型聚类算法

5.5 实验分析与评价

5.6 本章小结

第六章 总结与展望

6.1 论文的主要贡献

6.2 进一步的工作

致谢

参考文献

作者在学期间取得的学术成果

附录 英文缩写表

展开▼

摘要

多元时间序列在各个领域中广泛存在,如何从维度高、序列长度日益增长的时间序列中挖掘有效信息,发现隐藏模式,是一个具有重要意义的课题。作为时间序列数据挖掘的基础性工作,相比于一元时间序列,相似性分析在多元时间序列中的发展还不够成熟。通过阅读研究大量现有的时间序列相似性分析相关文献,针对目前已有方法中只能容忍一到两种变形、不能有效考虑变量的内部相关性及依赖参数设置等问题,本文分别从多元时间序列降维和改进现有一元时间序列方法两个角度出发,提出了两种面向多元时间序列的相似性度量方法。同时,在相似性度量的基础上,探索研究了基于K-近邻网络的多元时间序列聚类算法。
  本文的研究内容如下:
  (1)针对多元时间序列维度高、变量相关性强、序列不等长等特征,本文提出了一种基于分段范数表示和加权动态时间弯曲的多元时间序列相似性度量方法。首先,提出分层检测算法逐步检测多元时间序列的特征重要点,并通过基于误差的方法对多元时间序列进行统一分段。在分段基础上,引入Frobenius范数对分段矩阵及其协方差矩阵进行统一表示,从而得到降维压缩后的一元模式序列。最后,引入加权动态时间弯曲算法,对不等长的模式序列进行相似性度量,即可获得多元时间序列的相似性度量指标。
  (2)针对现有方法中忽略变量相关性和序列的局部形状特性问题,提出了一种基于共同主成分分析和局部特征改进的加权动态时间弯曲的多元时间序列相似性度量方法。首先,为了消除变量的内部相关性,并将各变量转换到同一个维度空间,引入并改进主成分分析方法,将多元时间序列转换为相互独立的主成分序列,并用各个主成分序列的方差贡献率作为该序列的权重。为了同时考虑时间序列的值特性和形态特征,引入时间序列点的特征值,改进加权动态时间弯曲算法,对变换后的主成分序列进行相似性度量。
  (3)针对现有聚类算法自发性弱、聚类效果差等问题,本文探索研究了基于 K-近邻网络的多元时间序列聚类算法。基于前文提出的相似性度量指标,以多元时间序列对象为点,K-近邻关系为边建立有向加权 K-近邻网络,权重值即为多元时间序列对象之间的相似度。在网络模型基础上,引入BGLL层次化社团结构划分算法,对网络中的时间序列对象进行聚类。
  为了对本文提出的多元时间序列相似性度量方法及聚类算法进行验证,本文分别采用了六个数据集进行相似性搜索、1-NN分类及网络聚类实验。实验结果表明,本文提出的方法具有切实可行性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号