首页> 中文学位 >时间序列数据相似性与聚合top-k查询算法研究与应用
【6h】

时间序列数据相似性与聚合top-k查询算法研究与应用

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.2 研究现状

1.2.1 时间序列数据挖掘

1.2.2 面向文物保护的时间序列数据存储管理

1.3 拟解决的关键问题

1.4 本文的研究内容

1.5 本文的组织结构

第2章 相关技术

2.1 时间序列数据相似性度量

2.2 时间序列数据聚合top-k查询

2.2.1 I/O高效算法模型

2.2.2 移动小波树索引

2.3 时间序列数据存储系统概述

2.3.1 时间序列数据库

2.3.2 Elasticsearch概述

2.4 本章小结

第3章 基于形状信息的相似性度量方法

3.1 时间序列相似性问题分析

3.2 问题定义及算法动机

3.2.1 问题定义

3.2.2 算法动机

3.3 基于形状信息的相似性度量

3.3.1 时间序列数据预处理

3.3.2 形状信息提取模型

3.3.3 趋势距离函数

3.4 实验结果

3.5 本章小结

第4章 I/O高效的时间序列数据聚合top-k查询

4.1 时间序列数据聚合top-k问题分析

4.2 问题定义及相关说明

4.3 I/O高效的聚合top-k查询算法

4.4 实验结果

4.5 本章小结

第5章 面向文物保护的时间序列数据管理原型系统

5.1 建设需求

5.2 系统建设目标

5.3 系统设计方案

5.3.1 技术路线

5.3.2 关键功能模块设计

5.4 系统实现

5.5 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间主要工作

致谢

展开▼

摘要

时间序列数据普遍存在于生活中各个方面的应用领域中。一般的,时间序列数据是一个包含时间戳及数值的有序序列。近年来随着传感网络等技术的发展,在金融、医疗、交通、环境监测、数字文物保护等领域高速产生并累积了大量的时间序列数据。如何高效的对海量时间序列数据进行挖掘和管理成为目前新的挑战。
  本文针对海量时间序列数据查询和管理方面存在的若干问题,研究了时间序列数据的相似性问题、聚合top-k查询问题并实现了面向文物保护的时间序列数据的管理原型系统等。本文的具体工作如下:
  研究了时间序列数据相似性问题,提出了基于形状信息的相似性度量方法——趋势距离相似性度量,解决了时间序列数据中的多种形变及多尺度相似性定义导致的难以准确判断数据间的相似度的问题。本文首先对目前已有的时间序列数据相似性度量方法进行了总结和分析,随后提出了趋势距离相似性度量方法并在多个数据集上进行了实验。
  研究了时间序列数据聚合top-k查询问题,提出了I/O高效的查询算法,解决了海量数据集上查询速度慢的问题。目前已有的时间序列数据聚合top-k查询算法的速度瓶颈在于查询过程中访问磁盘次数过多。为解决此问题,本文提出的算法引入新的索引结构和剪枝策略,实验结果表明该算法能有效降低查询过程中访问磁盘的次数,提高查询速度。
  设计并实现了面向文物保护的时间序列数据的管理原型系统。本系统包括时间序列数据流分析组件、历史时间序列数据存储管理组件及两者之间的连接,加强了文物监测现场的数据分析支持,更符合面向文物保护的时间序列数据管理需求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号