首页> 中国专利> 基于多时序因子和序列因子支配的多时间序列查询方法

基于多时序因子和序列因子支配的多时间序列查询方法

摘要

本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算机数据处理技术领域。首先定义两个单时间序列之间的序列因子支配关系和两个多时间序列之间的多时序因子和序列因子的支配关系:然后计算多时间序列的数值和组成多时间序列的每个单时间序列的数值,最后根据各多时间序列的输出值和支配关系,输出查询结果。本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的特征值。所以直接对多时间序列进行查询的效果要好于对特征值查询。本方法直接使用原始数据,避免了提取特征值等过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来提高查询效率,大大加快了查询的速度。

著录项

  • 公开/公告号CN102360384A

    专利类型发明专利

  • 公开/公告日2012-02-22

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN201110312403.6

  • 发明设计人 王朝坤;潘鹏;徐亚军;施炜;

    申请日2011-10-14

  • 分类号

  • 代理机构北京清亦华知识产权代理事务所(普通合伙);

  • 代理人罗文群

  • 地址 100084 北京市海淀区清华园1号

  • 入库时间 2023-12-18 04:34:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-05-01

    授权

    授权

  • 2012-04-04

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20111014

    实质审查的生效

  • 2012-02-22

    公开

    公开

说明书

技术领域

本发明涉及一种基于多时序因子和序列因子支配的多时间序列查询方法,属于计算 机数据处理技术领域。

背景技术

时间序列是现实生活中大量使用的一类数据,在自然界和人类社会中都有着极广泛 的应用,如地震波采样等。时间序列可分为多时间序列和单时间序列。单时间序列仅仅 从一个角度描述对象,而多时间序列则从多个角度描述对象本身,其数据信息会比单时 间序列丰富得多。

在有些领域中,虽然目前并没有使用基于多时序因子和序列因子支配的多时间序列 查询方法,但是它们也适用这种方法,而且效果会更好。以土木业的地震最不利选波为 例,目前的做法是对地震波的特征值进行Top-k查询,或直接人工观察选波。人工观察 选波依赖于人的主观认识和选波经验,且仅适合于在少量地震波上选波;Top-k查询是 在地震波特征值上进行查询,但特征值会受经验和模型所限制,因此查询结果会出现不 少的误解和漏解。地震波谱(多时间序列)就没有这样的约束限制,所以对地震波谱进 行查询,其查询效果(减少漏解、误解等)会好得多。因此最不利选波更适合使用基于 多时序因子和序列因子支配的多时间序列查询方法。

发明内容

本发明的目的是提出一种基于多时序因子和序列因子支配的多时间序列查询方法, 通过对多时间序列进行多时序因子和序列因子支配的比较,从而得到查询的结果。

本发明提出的基于多时序因子和序列因子支配的多时间序列查询方法,包括以下步 骤:

(1)定义两个单时间序列之间的序列因子支配关系:

设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序 排列的序列,即一个单时间序列TS=[v1,v2,...,vn],一个单时间序列中共有|TS|=n个时 戳,并且t1<t2<...<tn,用TS[t]表示TS在时戳t时的数值,设定一个序列因子k, 0<k≤1,对于两个单时间序列TS和TS’,若|T|≥k|w|,且满足条件(1)TS[t]≥TS’[t]和(2)TS[t]>TS’[t],则单时间序列TS在w上为序列因子支配单时间序 列TS’,记作其中w为时间窗口,

(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系:

设多时间序列MTS由m个单时间序列组成:MTS={TS1,TS2,...,TSm},其中m≥1, 对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0<k,k’≤1,以及 时间窗口w,若满足条件或MTS[i].w=MTS’[i].w}|≥k’m,和(2)使得则多时间序列MTS在时间窗口w上为多时序因子和序列因子支 配多时间序列MTS’,记作其中|MTS|=|MTS’|=m,MTS[i].w和MTS’[i].w 分别为多时间序列MTS和多时间序列MTS’中第i个单时间序列在时间窗口w中的子序 列,当MTS[i].w和MTS’[i].w的每个互相对应时戳的值相等时,MTS[i].w和MTS’[i].w相 等;

(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值:

(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多 个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与 该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列 同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一 个最大输出值,该最大输出值与该多时间序列相对应;

(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多 个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与 该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列 同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一 个最小输出值,该最小输出值与该多时间序列相对应;

(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列 的最大输出值和最小输出值;

(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子 支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最 大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列 MTS;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两 个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列 MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS 被其他多时间序列MTS’所支配,则不输出多时间序列MTS。

本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,其优点是:

1、本发明方法可以在多时间序列上进行查询,而不必使用由多时间序列提取得到的 特征值。因为经过采样得到的原始数据往往是以多时间序列的形式存储。原始数据含有 较全面的数据信息,而经过提取得到的特征值,往往会损失一些数据信息。例如在地震 波中,由于人们现在还无法完全认识地震波,因此提取得到的特征值并不能完全地反映 原始的地震波,即在特征提取过程中损失了部分数据信息。所以直接对多时间序列进行 查询的效果要好于对特征值查询。

2、本发明方法由于直接使用原始数据(多时间序列的形式),避免了提取特征值等 过程带来的额外代价,并通过限制时间窗口、计算各多时间序列的最大、最小输出值来 提高查询效率,大大加快了查询的速度。

具体实施方式

本发明方法假定数值之间的比较,以取较大者为优。

本发明提出的基于多时序因子和序列因子支配的多时间序列处理方法,包括以下步 骤:

(1)定义两个单时间序列之间的序列因子支配关系:

设一个单时间序列中的每个值对应一个时戳,一个单时间序列TS为一个按时戳顺序 排列的序列,即一个单时间序列TS=[v1,v2,...,vn],一个单时间序列中共有|TS|=n个时 戳,并且t1<t2<...<tn,用TS[t]表示TS在时戳t时的数值,设定一个序列因子k, 0<k≤1,对于两个单时间序列TS和TS’,若|T|≥k|w|,且满足条件(1)TS[t]≥TS’[t]和(2)TS[t]>TS’[t],则单时间序列TS在w上为序列因子支配单时间序 列TS’,记作其中w为单时间序列时间窗口,

(2)定义两个多时间序列之间的多时序因子和序列因子的支配关系:

设多时间序列MTS由m个单时间序列组成:MTS={TS1,TS2,...,TSm},其中m≥1, 对于两个多时间序列MTS和MTS’,设定序列因子k和多时序因子k’,0<k,k’≤1,以及 每个单时间序列的时间窗口w,若满足条件或 MTS[i].w=MTS’[i].w}|≥k’m,和(2)使得则多时间序列MTS在单 时间序列的时间窗口w上为多时序因子和序列因子支配多时间序列MTS’,记作其中|MTS|=|MTS’|=m,MTS[i].w和MTS’[i].w分别为多时间序列MTS和多时间序 列MTS’中第i个单时间序列在时间窗口w中的子序列,当MTS[i].w和MTS’[i].w的每个 互相对应时戳的值相等时,MTS[i].w和MTS’[i].w相等;

(3)计算多时间序列的数值和组成多时间序列的每个单时间序列的数值:

(3-1)从组成多时间序列的各单时间序列中分别提取多个最大的时戳数值,将多 个最大时戳数值作为单调递增函数的输入,得到一个第一输出值,建立各单时间序列与 该第一输出值之间的对应关系,一个第一输出值对应一个单时间序列,一个多时间序列 同时对应多个第一输出值;将该多个第一输出值作为上述单调递增函数的输入,得到一 个最大输出值,该最大输出值与该多时间序列相对应;

(3-2)从组成多时间序列的各单时间序列中分别提取多个最小的时戳数值,将多 个最小时戳数值作为单调递增函数的输入,得到一个第二输出值,建立各单时间序列与 该第二输出值之间的对应关系,一个第二输出值对应一个单时间序列,一个多时间序列 同时对应多个第二输出值;将该多个第二输出值作为上述单调递增函数的输入,得到一 个最小输出值,该最小输出值与该多时间序列相对应;

(3-3)重复步骤(3-1)和步骤(3-2),得到多个多时间序列中每个多时间序列 的最大输出值和最小输出值;

(4)根据多时间序列的输出值,对每任意两个多时间序列的多时序因子和序列因子 支配关系进行判断,若多时间序列MTS的最小输出值大于或等于多时间序列MTS’的最 大输出值,则多时间序列MTS不被其他多时间序列MTS’所支配,并输出该多时间序列 MTS;若多时间序列MTS的最小输出值小于多时间序列MTS’的最大输出值,则根据两 个多时间序列之间的多时序因子和序列因子的支配关系作进一步判断,若多时间序列 MTS不被其他多时间序列MTS’所支配,则输出该多时间序列MTS,若多时间序列MTS 被其他多时间序列MTS’所支配,则不输出多时间序列MTS。

本发明方法中,首先定义多时间序列之间的多时序因子和序列因子支配关系。建立 与多时间序列相对应的数值索引。

给定了多时间序列数据集dataSet,序列因子k,多时序因子k’和时间窗口w,为每一 个多时间序列MTS∈dataSet计算其对应的数值索引,包括:

对于MTS的每个单时间序列TS,计算第一输出值B(k|w|,TS)和第二输出值 W(k|w|,TS)。其中,W(k|w|,TS)=∑x∈Worst(kw,TS)F(x),B(k|w|,TS)=∑x∈Best(kw,TS)F(x),|w|表示时 间窗口w中包含的时戳数,Worst(k|w|,TS)表示单时间序列TS在w中的子序列中最小的 k|w|个时戳数值,Best(k|w|,TS)表示单时间序列TS在w中的子序列中最大的k|w|个时戳数 值,F(x)为某个单调递增函数,如F(x)=sgn(x)ln(|x|+1),sgn(x)为符号函数,定义为:

sgn(x)=|x|/x,x0;0,x=0..

对于多时间序列MTS,包含了m个单时间序列,因此多时间序列MTS包含m个第 一输出值B(k|w|,TS)和m个第二输出值W(k|w|,TS),计算最小输出值W(k’m,MTS)和最大输 出值B(k’m,MTS)。其中,W(k’m,MTS)=∑x∈Worst(k’m,MTS)F(x),B(k’m,MTS)=∑x∈Best(k’m,MTS)F(x),Worst(k’m,MTS)表示多时间序列MTS中最小的k’m个第二输出值W(k|w|,TS), Best(k’m,MTS)表示多时间序列MTS中最大的k’m个第一输出值B(k|w|,TS),F(x)为单调 递增函数。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号