首页> 中国专利> 一种多元时空仿真机器学习建模方法及系统

一种多元时空仿真机器学习建模方法及系统

摘要

一种多元时空仿真机器学习建模方法及系统,包括系统包括用于进行初级数据采集以及多层级分类数据处理的数据挖掘单元、用于数据分析建模的多元时空仿真单元和用于数据关联性计算以及整合筛选归纳的数据关联聚类单元;数据挖掘单元包括机器学习模块和数据库模块;多元时空仿真单元包括树状层级演算模块和层级时空仿真模块;数据关联聚类单元包括聚类算法模块、过滤对比模块和筛选归纳模块。本发明通过在原有的多元时空仿真学习建模方法中增加数据关联聚类单元,在各层级中增添了独立学习的数据分析,补充了多元时空内各数据模型的交叉建模仿真,是的整体建模方法得出的数据模型得到了聚类对比,增添了查找紧凑数据且集合出独立数据模型的功能。

著录项

  • 公开/公告号CN112711908A

    专利类型发明专利

  • 公开/公告日2021-04-27

    原文格式PDF

  • 申请/专利权人 长威信息科技发展股份有限公司;

    申请/专利号CN202011591515.5

  • 申请日2020-12-29

  • 分类号G06F30/27(20200101);G06N20/20(20190101);G06K9/62(20060101);

  • 代理机构11530 北京高航知识产权代理有限公司;

  • 代理人乔浩刚

  • 地址 350001 福建省福州市鼓楼区软件大道89号福州软件园F区5号楼13层

  • 入库时间 2023-06-19 10:46:31

说明书

技术领域

本发明涉及建模方法技术领域,尤其涉及一种多元时空仿真机器学习建模方法及系统。

背景技术

多元时间序列普遍存在于各个领域,其本身具有复杂时间特性以及空间特性。通过使用深度学习工具对多元时间序列数据进行时空特征的表征,来预测其未来的发展趋势,在能源消耗、交通流量和空气质量等各个领域具有重要的实际应用价值。

申请号为CN202010496285.8的中国发明,通过引入多层时空依赖的概念,使用基于CNN的通道注意力机制和基于CNN空间注意力机制来分别关注不同层的时空依赖特征,实现了对冗余信息的过滤以及对预测结果影响更大的特征的有效提取,达到了提高预测结果的目的,在不同领域内的多元时间序列数据上表现优异并且能够扩展到单元时间序列预测的任务上;但是该建模方法忽视了在各层级中独立学习的数据分析,缺少了多元时空内各数据模型的交叉建模仿真,导致整体建模方法的数据模型单一,缺少聚类对比,以及查找紧凑且独立数据模型的功能。

发明内容

(一)发明目的

为解决背景技术中存在的技术问题,本发明提出一种多元时空仿真机器学习建模方法及系统,该系统通过在原有的多元时空仿真学习建模方法中增加数据关联聚类单元,在各层级中增添了独立学习的数据分析,补充了多元时空内各数据模型的交叉建模仿真,是的整体建模方法得出的数据模型得到了聚类对比,在原有基础上增添了查找紧凑数据且集合出独立数据模型的功能。

(二)技术方案

本发明提供了一种多元时空仿真机器学习建模方法及系统,该系统包括用于进行初级数据采集以及多层级分类数据处理的数据挖掘单元、用于数据分析建模的多元时空仿真单元和用于数据关联性计算以及整合筛选归纳的数据关联聚类单元;数据挖掘单元包括机器学习模块和数据库模块;多元时空仿真单元包括树状层级演算模块和层级时空仿真模块;数据关联聚类单元包括聚类算法模块、过滤对比模块和筛选归纳模块。

优选的,机器学习模块根据数据内容,将学习类别分为符号学习和数值学习;机器学习模块中的学习方法包括归纳、演绎、类别和分析;机器学习模块的学习目标包括概念学习、规则学习、函数学习、类别学习和贝叶斯学习;机器学习模块的学习方式包括监督学习、非监督学习和强化学习;机器学习模块的学习策略包括模拟人脑和数学方式的策略;机器学习模块的输出数据形式包括结构化数据和非结构化数据;机器学习模块的输出端为数据库模块。

优选的,数据库模块包括初代数据采集库与多层级数据仿真库。

优选的,树状层级演算模块对数据进行迭代分析处理,在一元时空中划分出多组二元时空,在每组二元时空中分别划分出多组三元时空;依次类推,进行树状层级演算;树状层级演算模块对每组时空进行标号分组。

优选的,层级时空仿真模块设置多组,每组层级时空仿真模块分别与树状层级演算模块划分处的每层时空进行单独仿真运算,并且每层时空仿真模块分类标号;标号内容与树状层级演算模块的标号统一。

优选的,聚类算法模块采用K-Means算法,基于时空距离对数据挖掘单元采集的数据进行聚类运算;并且针对多元时空仿真单元处理所得的多组数据进行关联规则挖掘和计算,并将计算结果储存至每组时空所对应的数据库模块。

优选的,过滤对比模块对聚类算法模块得出的结果进行过滤对比,并将结果储存至对应的数据库模块中。

优选的,筛选归纳模块对过滤对比模块得出的结果进行筛选归纳,并将结果以数据文件的形式进行输出。

一种多元时空仿真机器学习建模系统,其运行方法如下:

S1、数据挖掘单元对待建模的数据系统进行采集学习;机器学习模块对数据进行处理,并将数据结果输出至数据库模块中;数据库模块将初代数据保存至初代数据采集库;

S2、多元时空仿真单元将初代数据通过树状层级演算模块进行分类标号,并草拟出多元时空的仿真树状图;

S3、层级时空仿真模块根据树状层级演算模块得出的仿真树状图,对初代数据库中的数据进行分层仿真运算;并将多层数据分类标号,分别储存至对应的多层级数据仿真库中;

S4、数据关联聚类单元将多层时空仿真数据通过K-Means算法,一一进行聚类运算,两个对象的距离越近,其相似度就越大,而相似度越大的若干对象可组成一个聚集,也被称为“簇”;最终K-Means算法从给定数据中集中并找到紧凑且独立的“簇”;

S5、过滤对比模块和筛选归纳模块对聚类算法模块得出的结果进行处理分析,并将结果数据储存至数据库模块中,最终生成数据文件。

与现有技术相比,本发明的上述技术方案具有如下有益的技术效果:通过在原有的多元时空仿真学习建模方法中增加数据关联聚类单元,在各层级中增添了独立学习的数据分析,补充了多元时空内各数据模型的交叉建模仿真,是的整体建模方法得出的数据模型得到了聚类对比,在原有基础上增添了查找紧凑数据且集合出独立数据模型的功能。

附图说明

图1为本发明提出的一种多元时空仿真机器学习建模方法及系统的模块示意图。

图2为本发明提出的一种多元时空仿真机器学习建模方法及系统中机器学习模块的模块示意图。

图3为本发明提出的一种多元时空仿真机器学习建模方法及系统中数据库模块的模块示意图。

图4为本发明提出的一种多元时空仿真机器学习建模方法及系统中树状层级演算模块的仿真树状图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。

如图1-4所示,本发明提出的一种多元时空仿真机器学习建模方法及系统,该系统包括用于进行初级数据采集以及多层级分类数据处理的数据挖掘单元、用于数据分析建模的多元时空仿真单元和用于数据关联性计算以及整合筛选归纳的数据关联聚类单元;数据挖掘单元包括机器学习模块和数据库模块;多元时空仿真单元包括树状层级演算模块和层级时空仿真模块;数据关联聚类单元包括聚类算法模块、过滤对比模块和筛选归纳模块。

在一个可选的实施例中,机器学习模块根据数据内容,将学习类别分为符号学习和数值学习;机器学习模块中的学习方法包括归纳、演绎、类别和分析;机器学习模块的学习目标包括概念学习、规则学习、函数学习、类别学习和贝叶斯学习;机器学习模块的学习方式包括监督学习、非监督学习和强化学习;机器学习模块的学习策略包括模拟人脑和数学方式的策略;机器学习模块的输出数据形式包括结构化数据和非结构化数据;机器学习模块的输出端为数据库模块。

在一个可选的实施例中,数据库模块包括初代数据采集库与多层级数据仿真库。

在一个可选的实施例中,树状层级演算模块对数据进行迭代分析处理,在一元时空中划分出多组二元时空,在每组二元时空中分别划分出多组三元时空;依次类推,进行树状层级演算;树状层级演算模块对每组时空进行标号分组。

在一个可选的实施例中,层级时空仿真模块设置多组,每组层级时空仿真模块分别与树状层级演算模块划分处的每层时空进行单独仿真运算,并且每层时空仿真模块分类标号;标号内容与树状层级演算模块的标号统一。

在一个可选的实施例中,聚类算法模块采用K-Means算法,基于时空距离对数据挖掘单元采集的数据进行聚类运算;并且针对多元时空仿真单元处理所得的多组数据进行关联规则挖掘和计算,并将计算结果储存至每组时空所对应的数据库模块;关联规则挖掘就是从数据背后发现数据之间可能存在的关联或者联系。

K-Means聚类算法的优点集中体现在算法快速、简单;对大数据集有较高的计算效率并且可伸缩;时间复杂度近于线性,适合挖掘大规模数据集。而K-Means的缺陷集中体现在:在K-Means算法中,K是事先设定的,而K值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该被分成多少个类别才最合适;在K-Means算法中,初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择得不好,可能无法得到有效的聚类结果;K-Means算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。

在关联规则挖掘场景下,一般用支持度和置信度两个阀值来度量关联规则的相关性。所谓支持度,指的是同时包含X、Y的百分比,即P(X,Y);所谓置信度指的是包含X(条件)的事务中同时又包含Y(结果)的百分比,即条件概率P(Y|X),置信度表示了这条规则有多大程度上可信。

在一个可选的实施例中,过滤对比模块对聚类算法模块得出的结果进行过滤对比,并将结果储存至对应的数据库模块中。

在一个可选的实施例中,筛选归纳模块对过滤对比模块得出的结果进行筛选归纳,并将结果以数据文件的形式进行输出。

一种多元时空仿真机器学习建模系统,其运行方法如下:

S1、数据挖掘单元对待建模的数据系统进行采集学习;机器学习模块对数据进行处理,并将数据结果输出至数据库模块中;数据库模块将初代数据保存至初代数据采集库;

S2、多元时空仿真单元将初代数据通过树状层级演算模块进行分类标号,并草拟出多元时空的仿真树状图;

S3、层级时空仿真模块根据树状层级演算模块得出的仿真树状图,对初代数据库中的数据进行分层仿真运算;并将多层数据分类标号,分别储存至对应的多层级数据仿真库中;

S4、数据关联聚类单元将多层时空仿真数据通过K-Means算法,一一进行聚类运算,两个对象的距离越近,其相似度就越大,而相似度越大的若干对象可组成一个聚集,也被称为“簇”;最终K-Means算法从给定数据中集中并找到紧凑且独立的“簇”;

S5、过滤对比模块和筛选归纳模块对聚类算法模块得出的结果进行处理分析,并将结果数据储存至数据库模块中,最终生成数据文件。

应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号