多元时间序列数据挖掘相似性分析方法及应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

多元时间序列在各个领域中广泛存在，如何从维度高、序列长度日益增长的时间序列中挖掘有效信息，发现隐藏模式，是一个具有重要意义的课题。作为时间序列数据挖掘的基础性工作，相比于一元时间序列，相似性分析在多元时间序列中的发展还不够成熟。通过阅读研究大量现有的时间序列相似性分析相关文献，针对目前已有方法中只能容忍一到两种变形、不能有效考虑变量的内部相关性及依赖参数设置等问题，本文分别从多元时间序列降维和改进现有一元时间序列方法两个角度出发，提出了两种面向多元时间序列的相似性度量方法。同时，在相似性度量的基础上，探索研究了基于K-近邻网络的多元时间序列聚类算法。
　　本文的研究内容如下：
　　（1）针对多元时间序列维度高、变量相关性强、序列不等长等特征，本文提出了一种基于分段范数表示和加权动态时间弯曲的多元时间序列相似性度量方法。首先，提出分层检测算法逐步检测多元时间序列的特征重要点，并通过基于误差的方法对多元时间序列进行统一分段。在分段基础上，引入Frobenius范数对分段矩阵及其协方差矩阵进行统一表示，从而得到降维压缩后的一元模式序列。最后，引入加权动态时间弯曲算法，对不等长的模式序列进行相似性度量，即可获得多元时间序列的相似性度量指标。
　　（2）针对现有方法中忽略变量相关性和序列的局部形状特性问题，提出了一种基于共同主成分分析和局部特征改进的加权动态时间弯曲的多元时间序列相似性度量方法。首先，为了消除变量的内部相关性，并将各变量转换到同一个维度空间，引入并改进主成分分析方法，将多元时间序列转换为相互独立的主成分序列，并用各个主成分序列的方差贡献率作为该序列的权重。为了同时考虑时间序列的值特性和形态特征，引入时间序列点的特征值，改进加权动态时间弯曲算法，对变换后的主成分序列进行相似性度量。
　　（3）针对现有聚类算法自发性弱、聚类效果差等问题，本文探索研究了基于 K-近邻网络的多元时间序列聚类算法。基于前文提出的相似性度量指标，以多元时间序列对象为点，K-近邻关系为边建立有向加权 K-近邻网络，权重值即为多元时间序列对象之间的相似度。在网络模型基础上，引入BGLL层次化社团结构划分算法，对网络中的时间序列对象进行聚类。
　　为了对本文提出的多元时间序列相似性度量方法及聚类算法进行验证，本文分别采用了六个数据集进行相似性搜索、1-NN分类及网络聚类实验。实验结果表明，本文提出的方法具有切实可行性和有效性。

著录项

作者
叶燕清;
展开▼
作者单位

国防科学技术大学;

展开▼
授予单位国防科学技术大学;
学科管理科学与工程
授予学位硕士
导师姓名杨克巍;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
相似性度量; 多元时间序列; 加权动态时间弯曲; K-近邻网络; 聚类算法; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 基于多维分段和动态权重DTW的多元时间序列相似性度量方法 [J] . 魏国强 ,周从华 ,张婷 . 计算机与数字工程 . 2021,第011期
2. 自适应代价动态时间弯曲的多元时间序列相似性度量 [J] . 孟晓静 ,万源 . 统计与决策 . 2020,第2期
3. 基于加权动态时间弯曲的多元时间序列相似性匹配方法 [J] . 叶燕清 ,杨克巍 ,姜江 . 模式识别与人工智能 . 2017,第004期
4. 多元时间序列相似性研究综述 [J] . 吴虎胜 ,张凤鸣 ,吴虎胜 . 统计与决策 . 2014,第7期
5. 多元时间序列的相似性匹配 [J] . 吴虎胜 ,张凤鸣 ,张超 . 应用科学学报 . 2013,第006期
6. 传感器网络中基于多元时间序列相似性的聚类压缩算法研究 [C] . 李兰 ,周四望 ,刘放彩 . CWSN’2009第三届中国传感器网络学术会议 . 2009
7. 多元时间序列数据挖掘中相似性算法的研究 [A] . 韩萌 . 2014

多元时间序列数据挖掘相似性分析方法及应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅