首页> 中国专利> 震后趋势分析方法、装置、电子设备及可读存储介质

震后趋势分析方法、装置、电子设备及可读存储介质

摘要

本申请提供一种震后趋势分析方法、装置、电子设备及可读存储介质,所述震后趋势分析方法包括:获取预设时间范围内的地震数据;对所述地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集;所述规范化地震数据集包括至少一个第二预设时间范围内的地震记录集合;每个所述地震记录集合中包括至少一个地震地点;基于所述规范化地震数据集和关联规则挖掘算法,得到所述地震地点间的关联规则。该方法利用大数据领域的关联规则挖掘算法,基于历史地震数据,得到地震地点间的关联规则,提高了震后趋势分析的准确性。

著录项

  • 公开/公告号CN116644386A

    专利类型发明专利

  • 公开/公告日2023-08-25

    原文格式PDF

  • 申请/专利权人 重庆数科金云科技有限公司;

    申请/专利号CN202310580059.1

  • 发明设计人 管宏伟;郭玮;

    申请日2023-05-22

  • 分类号G06F18/26(2023.01);G06N5/025(2023.01);

  • 代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463;

  • 代理人唐正瑜

  • 地址 401122 重庆市渝北区仙桃街道数据谷中路107号

  • 入库时间 2024-01-17 01:24:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-12

    实质审查的生效 IPC(主分类):G06F18/26 专利申请号:2023105800591 申请日:20230522

    实质审查的生效

说明书

技术领域

本申请涉及计算机领域,尤其涉及一种震后趋势分析方法、装置、电子设备及可读存储介质。

背景技术

随着互联网的发展,用户的所有行为都可以以数据形式沉淀下来,大数据技术应运而生,这种技术就是从用户的行为数据中探寻和挖掘数据间的关联性,从而能够更好的预测用户的相关行为。

目前的震后趋势预测方法,一般采用模糊数学的方法,通过与历史地震数据进行比较,预测当前地震比较像历史上哪一次地震,以此来预测后续地震趋势,但这种方法由于仍然基于模糊及经验的性质,预测结果并不准确。

发明内容

为了能够提高震后趋势预测的准确性,本申请提供一种震后趋势分析方法,装置、电子设备及可读存储介质。

第一方面,本申请提供一种震后趋势分析方法,包括:获取预设时间范围内的地震数据;对所述地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集;所述规范化地震数据集包括至少一个第二预设时间范围内的地震记录集合;每个所述地震记录集合中包括至少一个地震地点;基于所述规范化地震数据集和关联规则挖掘算法,得到所述地震地点间的关联规则。

在上述实现过程中,通过利用大数据领域的关联规则挖掘算法,从历史地震数据中挖掘出地震地点之间的关联关系,当有地震发生时,可以根据该地震地点历史地震地点间的关联关系得到后续会发生地震的地点,因此,能够使震后趋势分析得到的结果更加准确。

可选地,基于所述规范化地震数据集和关联规则挖掘算法,得到所述地震地点间的关联规则,包括:将所述规范化地震数据集中的地震地点进行去重处理,得到地震地点候选集合,所述地震地点候选集合中包括N个地震地点;其中,N为大于1的整数;确定所述地震地点候选集合的每个地震地点的支持度;所述每个地震地点的支持度为所述每个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中出现的概率;根据所述每个地震地点的支持度依次确定出频繁1地震地点集至频繁L地震地点集多个频繁地震地点集,所述频繁1地震地点集包括P个元素,P为大于等于1的整数,每个元素包括一个地震地点;所述频繁L地震地点集包括M个元素,M为大于等于1的整数,每个元素包括L个地震地点,L为大于等于2且小于等于N的任意整数;确定所述频繁2地震地点集至频繁L地震地点集中每个元素对该元素每个子集的置信度;根据所述置信度确定所述地震地点间的关联规则。

在上述实现过程中,通过计算地震地点的支持度,可以准确求出频繁发生地震的地点及地点组合,通过确定置信度的方法,能够准确确定出地震地点间的关联关系。

可选地,所述根据所述每个地震地点的支持度依次确定出频繁1地震地点集至频繁L地震地点集多个频繁地震地点集,包括:针对每个地震地点,当该地震地点的支持度大于预设阈值时,将该地震地点加入频繁1地震地点集中;所述频繁1地震地点集中的每个元素只有一个地震地点;获取所述频繁1地震地点集中任意两个地震地点,计算所述任意两个地震地点的第二支持度;所述任意两个地震地点的第二支持度为所述任意两个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率;针对所述任意两个地震地点,若所述第二支持度大于预设阈值时,将所述任意两个地震地点加入频繁2地震地点集中;所述频繁2地震地点集中的每个元素由两个地震地点组成;获取所述频繁2地震地点集中的任意三个地震地点,计算所述任意三个地震地点的第三支持度;所述任意三个地震地点的第三支持度为所述任意三个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率;若所述任意三个地震地点的第三支持度大于预设阈值时,将所述三个地震地点加入频繁3地震地点集中;所述频繁3地震地点集中的每个元素由三个地震地点组成;依次类推,直到不存在L+1个地震地点的支持度大于等于预设阈值,依次得到所述频繁1地震地点集至频繁L地震地点集多个频繁地震地点集。

在上述实现过程中,通过先计算频繁1地震地点集,能够快速筛选出频繁发生地震的单个地点,通过将频繁1地震地点集的数据作为频繁2地震地点集的候选集合,能够大量减少数据处理量,从而更加快速的确定出频繁2地震地点集及后续频繁地震地点集。

可选地,所述对所述地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集,包括:将所述地震数据按照第二预设时间范围进行分类,得到至少一个第二预设时间范围内的地震记录集合;针对所述地震记录集合中的每条地震数据,获取地震数据的经纬度,对所述经纬度加减所述经纬度范围,得到经纬度区间;若任意两条数据的经纬度区间有重合区域,则合并成同一地震地点;对所有的地震数据进行合并之后,得到所述规范化地震数据集。

在上述实现过程中,通过对地震数据的合并清洗,能够使得地震数据更加规范和简练,可用性更高。

可选地,所述确定所述地震地点候选集合的每个地震地点的支持度,包括:对所述候选集合构建哈希树;基于所述哈希树确定候选集合的每个地震地点的支持度。

在上述实现过程中,通过对地震地点候选集构建哈希树,使得地震地点候选集的元素能够较为均匀的分布在哈希树的各个叶子节点上,由于哈希树的深度较浅,相较于顺序遍历,能够通过少数几次查找就能够获取需要的元素,因此,在支持度计算中,能够提高统计效率。

第二方面,本申请提供一种震后趋势分析装置,所述震后趋势分析装置包括:获取模块,用于获取预设时间范围内的地震数据;数据处理模块,用于对所述地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集;所述规范化地震数据集包括至少一个第二预设时间范围内的地震记录集合;每个所述地震记录集合中包括至少一个地震地点;规则挖掘模块,用于基于所述规范化地震数据集和关联规则挖掘算法,得到所述地震地点间的关联规则。

可选地,所述震后趋势分析装置包括:所述规则挖掘模块,具体用于将所述规范化地震数据集中的地震地点进行去重处理,得到地震地点候选集合,所述地震地点候选集合中包括N个地震地点;其中,N为大于1的整数;确定所述地震地点候选集合的每个地震地点的支持度;所述每个地震地点的支持度为所述每个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中出现的概率;根据所述每个地震地点的支持度确定出频繁L地震地点集,所述频繁L地震地点集包括M个元素,M为大于等于1的整数,每个元素包括L个地震地点,L大于1且小于等于N,且为整数;确定所述频繁2地震地点集至频繁L地震地点集中每个元素对该元素每个子集的置信度;根据所述置信度确定所述地震地点间的关联规则。

可选地,所述震后趋势分析装置包括:所述规则挖掘模块,具体用于针对每个地震地点,当该地震地点的支持度大于预设阈值时,将该地震地点加入频繁1地震地点集中;所述频繁1地震地点集中的每个元素只有一个地震地点;获取所述频繁1地震地点集中任意两个地震地点,计算所述任意两个地震地点的第二支持度;所述任意两个地震地点的第二支持度为所述任意两个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率;针对所述任意两个地震地点,若所述第二支持度大于预设阈值时,将所述任意两个地震地点加入频繁2地震地点集中;所述频繁2地震地点集中的每个元素由两个地震地点组成;获取所述频繁2地震地点集中的任意三个地震地点,计算所述任意三个地震地点的第三支持度;所述任意三个地震地点的第三支持度为所述任意三个地震地点在所述规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率;若所述任意三个地震地点的第三支持度大于预设阈值时,将所述三个地震地点加入频繁3地震地点集中;所述频繁3地震地点集中的每个元素由三个地震地点组成;依次类推,直到不存在L+1个地震地点的支持度大于等于预设阈值,得到所述频繁L地震地点集。

第三方面,本申请提供一种电子设备,包括:处理器及存储器;所述处理器用于执行所述存储器中存储的程序,以实现如第一方面中任一项所述的震后趋势分析方法。

第四方面,本申请提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如第一方面中任一项所述的震后趋势分析方法。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例一提供的一种震后趋势分析方法的流程示意图;

图2为本申请实施例一提供的一种震后趋势分析方法的流程示意图;

图3为本申请实施例一提供的一种震后趋势分析方法的流程示意图;

图4为本申请实施例一提供的一种震后趋势分析方法的流程示意图;

图5为本申请实施例二提供的一种具体应用场景下确定频繁地震地点集的示意图;

图6为本申请实施例三提供的一种震后趋势分析装置的结构示意图;

图7为本申请实施例四提供的一种电子设备结构示意图。

具体实施方式

目前的震后趋势分析方法囿于经验和模糊数学的方法,对于震后趋势的预测并不准确,为了提高震后趋势分析的准确性,本申请提供一种震后趋势分析方法,该方法利用大数据领域的关联规则挖掘算法,根据历史地震数据,得到地震地点间的关联关系,提高了震后趋势分析的准确性。

为了更好的理解本申请提供的震后趋势分析方法,下面对应用场景做详细介绍。

本申请提供的震后趋势分析方法应用于地震后的趋势分析场景中,即当一个地点发生地震后,根据本申请的方法,通过采用关联规则挖掘算法得到历史地震数据间的关联规则,从中找到发生地震的地点,根据该地震地点的关联规则得到后续对应可能发生地震的地点。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

实施例一

为了更加准确的进行震后趋势分析,本申请实施例提供一种震后趋势分析方法,如图1所示,具体包括以下步骤:

S101:获取预设时间范围内的地震数据。

其中,预设时间范围不做具体限定,示例性地,可以为十年。一条地震数据为一个地震目录。地震目录包括地震日期、时间、经纬度、震级、震级类型、事件类型、参考地点等字段。

具体地,地震数据可以从地震相关的网站或有关部门网站上下载得到。

可选地,由于震级类型可以分为浅震、深震、远震、近震等不同类型的震级,因此,为了更准确的筛选地震数据,可以根据震级统一公式将震级预先调整成统一的近震震级,然后筛选出预设震级以上的地震数据,其中,预设震级不做具体限定,可以根据实际的需要设置相应的数值。

可选地,由于事件类型包括天然地震、爆破、塌陷、火山构造地震、非天然地震、火山爆炸等类型,因此,为了使地震数据更有针对性,可以预先筛选出需要的事件类型的地震数据。

S102:对地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集。规范化地震数据集包括至少一个第二预设时间范围内的地震记录集合。每个地震记录集合中包括至少一个地震地点。

其中,第二预设时间范围表征一个地震周期,取值范围不做具体限定,示例性地,可以为两个月。经纬度范围表征同一地震地点允许的经纬度偏差,取值范围不做具体限定。示例性地,可以为0.5度。

根据地震日期,将地震数据先划分成多组第二预设时间范围的地震数据,针对每组地震数据,依次读取每条地震数据,将地震数据的经纬度加减经纬度范围,得到当前地震数据的经纬度范围,若后续地震数据的经纬度落入当前地震数据的经纬度范围内,则合并两条数据。

示例性地,1到2月有三条地震数据,分别是地点A、地点B、地点C。地点A的经纬度为125.3度、29度,地点B的经纬度为125度、29.5度,地点C的经纬度为128度、33度。获取地点A的经纬度,在地点A的经纬度基础上加减0.5度,得到地点A的经纬度范围为124.8~125.8度、28.5~29.5度。获取地点B的经纬度,由于地点B的经度125度处于124.8~125.8度的区间内,且地点B的纬度29.5度处于28.5~29.5度的区间内,因此,判定地点B与地点A为同一地点。同理,获取地点C的经纬度,由于地点C的经度128度不在地点A的经度范围124.8~125.8的范围内,因此,地点C与地点A不是同一地震地点。

可选地,为了更方便的比较多条地震数据的经纬度范围,可以先按照经纬度对地震数据进行排序,使得经纬度相近的数据相邻排列。

可选地,对于同组内的地震数据,也可以仅将同一日期同一经纬度范围的地震数据合并为一条地震数据,将同一经纬度范围但不同日期的地震数据分别保存。

在一种可行的实施方式中,如图2所示,步骤S102对地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集,包括:

S1021:将地震数据按照第二预设时间范围进行分类,得到至少一个第二预设时间范围内的地震记录集合。

具体地,根据地震数据的日期和第二预设时间范围对地震数据进行分组。示例性地,第二预设时间范围为两个月,起始日期为1月1日,那么,对地震数据分组,就是将日期在1月1日到2月28日、3月1日到4月30日、5月1日到7月31日、8月1日到10月31日、11月1日到12月31日的地震数据分成不同的组,每个分组为一个地震记录集合。

S1022:针对地震记录集合中的每条地震数据,获取地震数据的经纬度,对经纬度加减经纬度范围,得到地震数据的经纬度区间。

示例性地,从1月到2月的地震记录集合中获取一条地震数据,该地震数据的经纬度为103.4度、31.6度,经纬度范围为0.5度,用103.4度加减0.5度,得到经度范围102.9度~103.9度,用31.6度加减0.5度,得到纬度范围31.1度~32.1度。对每条地震数据,均采用上述方法求得经纬度区间。

S1023:若任意两条地震数据的经纬度区间有重合区域,则合并成同一地震地点。

具体地,判断任意两条地震数据的经纬度区间是否有重合区域,如果经、纬度区间均有重合,则证明两条地震数据的经、纬度相差不大,属于同一地震地点,因此,可以合并为同一地震地点。

S1024:对所有的地震数据进行合并之后,得到规范化地震数据集。

具体地,经过上述步骤的处理,得到合并重复数据后的规范化地震数据集。

在上述实现过程中,通过对地震数据的合并清洗,能够使得地震数据更加规范和简练,可用性更高。

S103:基于规范化地震数据集和关联规则挖掘算法,得到地震地点间的关联规则。

其中,关联规则挖掘算法不做具体限定,示例性地,可以是Apriori算法、FP-Group算法、Eclat算法、灰度关联度算法等。

具体地,将规范化地震数据集作为输入数据输入到关联规则挖掘算法中,得到地震地点间的关联规则。

在一种可行的实施方式中,如图3所示,步骤S103基于规范化地震数据集和关联规则挖掘算法,得到地震地点间的关联规则,包括:

S1031:将规范化地震数据集中的地震地点进行去重处理,得到地震地点候选集合,地震地点候选集合中包括N个地震地点。其中,N为大于1的整数。

具体地,构建地震地点候选集合,该集合初始为空。获取规范化地震数据集中的每个地震地点,针对每个地震地点,将该地震地点与地震地点候选集合中的元素进行比较,若不相同,则将该地震地点加入到地震地点候选集合中。

可选地,为了能够提升后续步骤中地震地点支持度的计算效率,可以将地震地点候选集合中的每个地震地点文本映射为一个数字编号。

S1032:确定地震地点候选集合的每个地震地点的支持度。每个地震地点的支持度为每个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中出现的概率。

具体地,从地震地点候选集中获取地震地点,然后遍历所有第二预设时间范围内的地震记录集合,将该地震地点与所有地震记录集合内的地震地点进行比对,若为同一地震地点,该地震地点的出现次数加1。按照上述方法统计出该地震地点在所有地震记录集合出现的次数,然后可以按照支持度计算公式确定地震地点的支持度,支持度计算公式可以表达为:

P=C

其中,C

示例性地,地震地点为“地点A”,预设时间范围内共有20个地震记录集,地点A在这20个地震记录集中出现了5次,那么地点A这个地震地点的支持度为:P=5/20*%=25%。

在一种可行的实施方式中,步骤S1032确定地震地点候选集合的每个地震地点的支持度,包括:

S10321:对候选集合构建哈希树。

由于在计算支持度时需要统计地震地点在所有第二预设时间范围内的地震记录集中出现的次数,因此,需要扫描整个数据库,将地震地点候选集中的每个地震地点与所有地震记录集合中的地震地点做比较。因此,为了能够提高支持度的计算效率,在计算支持度时,先对地震地点候选集中的所有元素构建哈系树。根据分布规则,不同元素会分布到不同的叶子节点。这样,在进行比较时,就可以通过有限次的查找,将地震记录集合与哈希树中部分叶子节点对应的元素进行比较,以提高支持度统计效率。哈希树的构建方法可以参考现有技术中的方式,在此不再一一赘述。

可选地,也可以对所有第二预设时间范围内的地震记录集构建哈希树,以进一步提高支持度统计效率。

S10322:基于哈希树确定候选集合的每个地震地点的支持度。

在计算地震地点支持度时,根据地震地点候选集元素分布规则,通过较少的查找次数就能够获取哈希树的叶子节点,从而获取到任意的地震地点,统计出地震地点在所有地震记录集中出现次数。将地震地点在所有地震记录集中出现次数除以所有的地震记录集的数目,得到地震地点的支持度。

在上述实现过程中,通过对地震地点候选集构建哈希树,使得地震地点候选集的元素能够较为均匀的分布在哈希树的各个叶子节点上,由于哈希树的深度较浅,相较于顺序遍历,能够通过少数几次查找就能够获取需要的元素,因此,在支持度计算中,能够提高统计效率。

S1033:根据每个地震地点的支持度依次确定出频繁1地震地点集至频繁L地震地点集多个频繁地震地点集,频繁1地震地点集包括P个元素,P为大于等于1的整数,每个元素包括一个地震地点。频繁L地震地点集包括M个元素,M为大于等于1的整数,每个元素包括L个地震地点,L为大于等于2且小于等于N的任意整数。

具体地,根据每个地震地点的支持度依次确定出频繁1地震地点集至频繁L地震地点集多个频繁地震地点集的方法不做限定。

可选地,为了能够并行处理地震地点候选集,可以将候选集内的地震地点进行组合,分别从地震地点候选集中任意取两个地震地点、三个地震地点、...L个地震地点进行组合,将每个组合作为一个元素添加到候选集中,根据元素内地震地点的数量分成不同的子集,分别对每个子集的每个元素求支持度,若支持度大于预设阈值,则将其分别添加到L取值不同的频繁L地震地点集中,其中,L的取值范围为2~N。这样就能够同时求得所有的频繁地震地点集。

在一种可行的实施方式中,如图4所示,步骤S1033根据每个地震地点的支持度依次确定出频繁1地震地点集至频繁L地震地点集多个频繁地震地点集,包括:

S10331:针对每个地震地点,当该地震地点的支持度大于预设阈值时,将该地震地点加入频繁1地震地点集中。频繁1地震地点集中的每个元素只有一个地震地点。

其中,频繁1地震地点集为地震地点的发生地震概率大于预设阈值的地震地点的集合,集合中每个元素只包括一个地震地点,即地震地点间没有相互关联性。预设阈值即为最小支持度,取值范围不做具体限定,示例性地,可以是0.01。

按照地震地点支持度的公式计算每个地震地点的支持度,将支持度大于预设阈值的地震地点加入到频繁1地震地点集中。

某一地震地点支持度的计算公式可以表达为:

P=C

其中,C

S10332:获取频繁1地震地点集中任意两个地震地点,计算任意两个地震地点的第二支持度。任意两个地震地点的第二支持度为任意两个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率。

具体地,将频繁1地震地点集作为新的地震地点候选集合,从频繁1地震地点集中获取任意两个地震地点,根据第二支持度计算公式计算上述两个地震地点的第二支持度,第二支持度的计算公式可以表达为:

P

其中,C

示例性地,两个地震地点分别为“地点A”、“地点B”,预设时间范围内的所有地震记录集的数目为20个,“地点A”、“地点B”在所有地震记录集中同时出现的次数为3次,那么这两个地震地点的第二支持度为:P

S10333:针对任意两个地震地点,若第二支持度大于预设阈值时,将任意两个地震地点加入频繁2地震地点集中。频繁2地震地点集中的每个元素由两个地震地点组成。

其中,频繁2地震地点集为两个地震地点间具有地震关联性且相继发生地震概率大于预设阈值的每两个地震地点的集合。

具体地,将第二支持度大于预设阈值的任意两个地震地点加入到频繁2地震地点集中。

S10334:获取频繁2地震地点集中的任意三个地震地点,计算任意三个地震地点的第三支持度。任意三个地震地点的第三支持度为任意三个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率。

具体地,将频繁2地震地点集作为新的地震地点候选集合,将频繁2地震地点集中的每三个元素组合,得到任意三个地震地点的所有组合,根据第三支持度计算公式计算上述每三个地震地点的第三支持度,第三支持度的计算公式可以表达为:

P

其中,C

S10335:若任意三个地震地点的第三支持度大于预设阈值时,将三个地震地点加入频繁3地震地点集中。频繁3地震地点集中的每个元素由三个地震地点组成。

其中,频繁3地震地点集为三个地震地点间具有地震关联性且相继发生地震概率大于预设阈值的每三个地震地点的集合。

具体地,将第三支持度大于预设阈值的任意三个地震地点加入到频繁3地震地点集中。

S10336:依次类推,直到不存在L+1个地震地点的支持度大于等于预设阈值,依次得到频繁1地震地点集至频繁L地震地点集多个频繁地震地点集。

具体地,由于地震地点越多,多个地震地点同时出现在所有第二预设时间范围内的地震记录集的概率越小,因此,当计算得到频繁L地震地点集后,再计算频繁L+1地震地点集时,会得到下面的结果,即L+1个地震地点的支持度小于预设阈值,此时,频繁L+1地震地点集中的元素为空,说明频繁L地震地点集为元素包含的地震地点数目最大的频繁地震地点集,此时,就可以得到所有(从频繁1地震地点集到频繁L地震地点集)频繁地震地点集。

在上述实现过程中,通过先计算频繁1地震地点集,能够快速筛选出频繁发生地震的单个地点,通过将频繁1地震地点集的数据作为频繁2地震地点集的候选集合,能够大量减少数据处理量,从而更加快速的确定出频繁2地震地点集及后续频繁地震地点集。

S1034:确定频繁2地震地点集至频繁L地震地点集中每个元素对该元素每个子集的置信度。

其中,置信度即是数学上的条件概率,即在某个地震地点或地震地点组合已经发生地震的前提下,另一地震地点或地震地点组合发生地震的概率。在本申请实施例中,也可以认为是频繁地震地点集中元素支持度的比值。

置信度的计算公式可以表达为:

P(Y|X)=P(X∩Y)/P(X)

其中,X、Y均为频繁地震地点集中的元素,P(X∩Y)为元素X与Y的支持度,P(X)为元素X的支持度。在本申请实施例中,元素X和Y均可以包含至少一个地震地点。

示例性地,频繁3地震地点集中某元素R3=(“地点A”、“地点B”、“地点E”),该元素R3的第三支持度P

P(R2|R1)=P

接上述示例,频繁2地震地点集中存在元素R2=(“地点B”、“地点E”),该元素的第二支持度为P

P(R1|R2)=P

具体地,当置信度大于最小置信度时,说明地震地点间具有关联性。

接上述示例,令最小置信度为20%,置信度P(R2|R1)大于最小置信度,此时,R1->R2,即在地点A发生地震的前提下,有48%的概率地点B和地点E也会发生地震。依照上述方法,就可以求出地震地点间的关联关系。

在上述实现过程中,通过计算地震地点的支持度,可以准确求出频繁发生地震的地点及地点组合,通过确定置信度的方法,能够准确确定出地震地点间的关联关系。

在上述实现过程中,通过利用大数据领域的关联规则挖掘算法,从历史地震数据中挖掘出地震地点之间的关联关系,能够使震后趋势分析得到的结果更加准确。

实施例二

为了更加直观的说明如何得到频繁地震地点集,本申请实施例提供一种具体应用场景下根据地震地点支持度确定频繁地震地点集的方法。

如图5所示,图中第一个表格为八个月内的地震记录集合,每两个月为一个地震记录集。

遍历表格,统计地震记录集中每个地震地点的支持度,得到第二个表格。

示例性地,地点A在第一个表格中出现了两次,地震记录集的数量为4,因此,地点A的支持度为50%,其他地震地点依此类推。

将第二个表格作为地震地点候选集C1,筛选出支持度大于最小支持度的地震地点,组成频繁1地震地点集,如第二行第二个表格所示。

将频繁1地震地点集作为频繁2地震地点集的候选集C2,如第二行第一个表格所示。将频繁1地震地点集中的地震地点进行两两组合,在第一个表格中统计出每两个地震地点的第二支持度,筛选出第二支持度大于最小支持度的地震地点组合,组成频繁2地震地点集,如第三行第一个表格所示。

示例性地,地点A、地点D在第一个表格中同时出现了1次,地震记录集的数量为4,因此,地点A、地点D的第二支持度为25%。

将频繁2地震地点集作为频繁3地震地点集的候选集C3,如第三行第二个表格所示。从频繁2地震地点集的所有地震地点中任意选取三个不重复的地震地点作为一个元素,并计算每三个地震地点的第三支持度,筛选出第三支持度大于最小支持度的地震地点组合,组成频繁3地震地点集,如第四行的表格所示。

示例性地,地点D、地点B、地点A在第一个表格中同时出现的次数为1次,因此,地点D、地点B、地点A的第三支持度为25%。

依次类推,可以获得所有的频繁地震地点集。

实施例三

为了更准确的进行震后趋势分析,本申请实施例提供一种震后趋势分析装置300,如图6所示,装置300包括:获取模块301、数据处理模块302、规则挖掘模块303。

获取模块301,用于获取预设时间范围内的地震数据。

数据处理模块302,用于对地震数据按照第二预设时间范围及经纬度范围进行合并,得到规范化地震数据集。规范化地震数据集包括至少一个第二预设时间范围内的地震记录集合。每个地震记录集合中包括至少一个地震地点。

规则挖掘模块303,用于基于规范化地震数据集和关联规则挖掘算法,得到地震地点间的关联规则。

可选地,规则挖掘模块303,具体用于将规范化地震数据集中的地震地点进行去重处理,得到地震地点候选集合,地震地点候选集合中包括N个地震地点。其中,N为大于1的整数。确定地震地点候选集合的每个地震地点的支持度。每个地震地点的支持度为每个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中出现的概率。根据每个地震地点的支持度确定出频繁L地震地点集,频繁L地震地点集包括M个元素,M为大于等于1的整数,每个元素包括L个地震地点,L大于1且小于等于N,且为整数。确定频繁2地震地点集至频繁L地震地点集中每个元素对该元素每个子集的置信度。根据置信度确定地震地点间的关联规则。

可选地,规则挖掘模块303,具体用于针对每个地震地点,当该地震地点的支持度大于预设阈值时,将该地震地点加入频繁1地震地点集中。频繁1地震地点集中的每个元素只有一个地震地点。获取频繁1地震地点集中任意两个地震地点,计算任意两个地震地点的第二支持度。任意两个地震地点的第二支持度为任意两个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率。针对任意两个地震地点,若第二支持度大于预设阈值时,将任意两个地震地点加入频繁2地震地点集中。频繁2地震地点集中的每个元素由两个地震地点组成。获取频繁2地震地点集中的任意三个地震地点,计算任意三个地震地点的第三支持度。任意三个地震地点的第三支持度为任意三个地震地点在规范化地震数据集的所有第二预设时间范围内的地震记录集合中同时出现的概率。若任意三个地震地点的第三支持度大于预设阈值时,将三个地震地点加入频繁3地震地点集中。频繁3地震地点集中的每个元素由三个地震地点组成。依次类推,直到不存在L+1个地震地点的支持度大于等于预设阈值,得到频繁L地震地点集。

实施例四

本申请实施例提供一种电子设备400,如图7所示,电子设备400包括:处理器401及存储器402。处理器401用于执行存储器402中存储的程序,以实现如实施例一或实施例二中任一项所述的方法。

可以理解,图7所示的结构仅为示意,设备还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。

处理器401可以是一种集成电路芯片,具有信号处理能力。上述处理器401可以是通用处理器,包括中央处理器(CPU)、网络处理器(NP)等。还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。

存储器402可以包括但不限于随机存取存储器(RAM),只读存储器(ROM),可编程只读存储器(PROM),可擦除只读存储器(EPROM),电可擦除只读存储器(EEPROM)等。

本实施例还提供了一种计算机可读存储介质,如软盘、光盘、硬盘、闪存、U盘、安全数码(SD)卡、多媒体(MMC)卡等,在该计算机可读存储介质中存储有实现上述各个步骤的一个或者多个程序,这一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例一或实施例二中所述方法的各步骤,在此不再赘述。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。

以上仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号