首页> 中文学位 >面向时间序列分类任务的SAX方法研究
【6h】

面向时间序列分类任务的SAX方法研究

代理获取

目录

声明

摘要

图目录

表目录

1 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.3 SAX应用研究所面临的主要问题

1.4 主要研究内容

1.5 论文组织结构

2 相关工作

2.1 SAX方法

2.2 BOP方法

2.3 影响SAX表示效果的参数因素

2.4 衡量时间序列特征表示方法性能的指标及度量标准

2.5 本章小结

3 基于机器学习的SAX方法有效性验证与性能提升

3.1 研究动机

3.2 相关工作

3.2.1 集成学习方法

3.2.2 多变量时间序列及其分类

3.2.3 深度学习及卷积神经网络方法

3.3 基于SAX特征表示的多阶段集成分类框架

3.3.1 实验数据

3.3.2 相关实验及结果分析

3.4 基于卷积网络与SAX表示的多变量时间序列特征提取模型

3.4.1 unpooling与反卷积

3.4.2 基于反卷积重构验证的MTS特征学习

3.4.3 用于分类的SAX及BOP特征表示

3.4.4 实验及结果分析

3.5 本章小结

4 基于统计视角的SAX方法内在特性度量研究

4.1 研究动机

4.2 相关工作

4.2.1 排列熵

4.2.2 信息嵌入成本

4.2.3 自相关与偏自相关函数

4.3 基于统计视角的SAX特性度量及实验分析

4.3.1 实验数据及SAX参数选择

4.3.2 PE值与复杂度

4.3.3 信息嵌入效率

4.3.4 周期性与相关性

4.4 本章小结

5 基于复杂网络的SAX方法可视化探索

5.1 研究动机

5.2 相关工作

5.2.1 可视化的基本概念

5.2.2 可视化分支及与其它领域学科关系

5.2.3 可视化的流程

5.2.4 可视化的意义与挑战

5.3 时间序列可视化

5.3.1 时间序列及其可视化

5.3.2 时间序列可视化的主要任务及研究进展

5.3.3 可视化增强的数据挖掘方法

5.4 基于复杂网络的SAX可视化探索

5.4.1 复杂网络及相关研究

5.4.2 复杂网络可视化

5.4.3 时间序列数据的离散化特征表示与转化

5.4.4 转移矩阵可视化

5.5 实验及结果分析

5.5.1 实验数据及相关参数

5.5.2 数据可视化呈现

5.5.3 实验结果及分析

5.6 本章小结

6 总结与展望

6.1 工作总结

6.2 研究展望

参考文献

在学期间发表的学术论文、知识产权及参加的基金项目

致谢

展开▼

摘要

特征表示与度量可以将原始时间序列数据映射到低维特征空间,在保持和反映基本形态、特征和有效信息的前提下,达到数据降维、去除噪声以及减少计算代价的目的。
  符号化聚合近似(Symbolic Aggregate approXimation,SAX)方法因其简单直观且行之有效的特点,成为一种最为典型的符号化特征表示方法。但是该方法仍存在一些值得进一步深入探讨的问题:1)SAX方法难以避免有效信息的损失,从而对数据挖掘与分析的精度与准确性产生影响;2)SAX方法在单变量时间序列处理上的应用较为常见,而在多变量时间序列数据处理方面,相关研究相对缺乏;3)对SAX方法内在特性,如复杂度、信息损失、关联性及周期性等方面的分析研究不够深入;4)对SAX方法的可视化研究较为缺乏。
  正是在此背景下,本文面向时间序列分类任务,提出了相应的框架、模型与统计度量方法。本文主要贡献和创新点如下:
  1)针对SAX方法的有效信息损失问题,构建了基于集成学习方法的多阶段分类框架。本文利用机器学习方法中的集成学习思想,对多种不同参数表示的多样性信息进行整合,建立多阶段分类框架,弥补信息损失,提高整个分类器的效率,从而提高时间序列分类的准确性。
  2)针对多变量时间序列特征表示问题,提出并构建了基于深度学习的多变量时间序列数据特征提取模型CNMMRDV(Convolutional Network Model for MTS Representation based on Deconvolutional Verification)。该模型利用卷积神经网络及SAX方法获取多变量时间序列相关性特征,并利用模型中的反卷积验证非监督学习得到的特征质量。
  3)针对SAX方法的内在特性度量问题,提出了信息嵌入成本(Information Embedding Cost,IEC)这一新的度量标准,对SAX进行量化分析。该度量标准可以准确分析SAX方法的信息嵌入效率,且可以从一定程度上反映SAX方法与不同数据集分类性能之间的关系;复杂度、信息嵌入效率、相关性与周期性等度量标准可以为SAX方法的改进,以及新的特征表示方法的设计提供参考。
  4)针对SAX方法的可视化展示与分析问题,构建可视化分析方法对SAX进行可视化呈现及相关特性分析。基于复杂网络理论,提出了将时间序列SAX离散化特征表示与马尔科夫矩阵相结合,并通过网络图进行可视化的方法,实现时间序列数据特征表示可视化及预分析的目的。
  本文采用UCR时间序列分类聚类数据集、CMU的MTS数据集以及临床医疗生理数据集进行了相关实验。实验结果表明,多阶段框架可以较好解决SAX符号化特征表示过程中的有效信息损失问题;CNMMRDV模型有效解决了多变量时间序列数据跨通道相关特性的提取问题。以上两方面实验在时间序列数据分类任务中表现突出,进一步验证了SAX方法的有效性和优良效果;SAX内在特性度量的相关实验表明了IEC分值与分类性能之间的关系;基于复杂网络图的可视化实验实现了在一定程度上探索隐含特征,以及时间序列预分析的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号