首页> 中国专利> 自动处理数据标识符的方法、设备和计算机程序

自动处理数据标识符的方法、设备和计算机程序

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及一种用于自动处理数据标识符(20、22)的方法、设备和计算机程序，其中，与数据标识符(20、22)相关联的数据(12)被发送至云平台(16)和在那里的分析单元(32)，分析单元具有至少一个功能单元(40‑50)，其中，每个功能单元(40‑50)都对数据(12)和/或关联的数据标识符(20、22)进行分析并输出置信度值作为分析结果，其中，将每个置信度值映射到总置信度值(60)，其中，该总置信度值(60)编码两个数据标识符(20、22)之间的相关性，其中，得出为相关的数据标识符(20、22)被汇总到上级变量名(66)下并且其中，上级变量名(66)可用于数据库查询，其提供相关于汇总到该上级变量名(66)下的所有数据标识符(20、22)的数据，其中，数据标识符(20、22)与高于预定或可预定的阈值的总置信度值(60)相关。

著录项

公开/公告号CN112868217A

专利类型发明专利
公开/公告日2021-05-28

原文格式PDF
申请/专利权人西门子股份公司;
展开▼

申请/专利号CN201980068889.8
发明设计人菲利普·波特;帕拉格·莫格勒;
展开▼

申请日2019-10-15
分类号H04L29/08(20060101);
代理机构11240 北京康信知识产权代理有限责任公司;
代理人沈敬亭
地址德国慕尼黑
入库时间 2023-06-19 11:06:50

说明书

技术领域

本发明涉及一种用于自动处理数据标识符的方法。数据标识符特别是变量名，创建变量时实例化的数据类型的名称以及组合数据类型的名称。本发明还涉及用于实施自动处理数据标识符的方法的设备，以及涉及具有该方法的实现的计算机程序。

背景技术

借助现代自动化技术，主要借助于在物联网(IoT)范畴内给出的用于数据检测的可行性能够产生极大的数据量。由于不同的原因，对它们的评估能够是很有兴趣和期望的。例如，在将数据传输至所谓的云平台(以下称为IoT平台)的情况下，能够将不同的但类型相同的设施进行对比，从而例如比较其性能或预测设施的故障。但是，用于评估这些数据的可能性、主要是用于自动评估的可行性有时受到限制。

风力发电设施或者组合形成风场的风力发电设施能够用作相同类型的设施的(非限制性)实例。每个风力发电设施都能够将性能数据传输至云平台。如果借助于相同的数据标识符(例如“性能”)传输它们，则云平台方面能够自动将性能数据彼此分配，例如，在时间轴上显示各个风力发电设施的性能数据。以这种方式能够实现对单个风力发电设施的性能的快速比较。

然而，如果不同的数据标识符用于相同或相同类型的数据，例如用于上述性能数据，则是有问题的。这样就不能够实现自动的分配，并且需要人类专家的干预。在上述情形中能考虑的数据标识符的简单实例是诸如“功率”和“性能”的标识符。由此标识的数据不能没有问题地被自动识别为相同的或相同类型的(在下文中称为“相关的”)。但是，人类专家的必要的干预是复杂的并且容易出错。在此，必须考虑的是，对于在云平台中传输的数据，通常不仅会传输单一类型的数据(例如功率数据)，而且还会传输很多不同的数据，例如能够借助于由相应的设施包括的传感器直接或间接检测该数据。在需要手动分配时，传输的数据的庞大的量导致上述可观的、尤其是时间方面的耗费。在所需时间的背景下，通过人类专家进行评估时的容易出错性也不容忽视。

概述的耗费和容易出错性导致根本没有进行分配，而缺失的分配使原则上给定的用于评估传输至云平台的数据的可行性未使用，并阻止了例如对优化可行性、错误或即将发生的错误情况等的识别。

从US 2011/0055121 A1中已知一种用于识别观察到的现象的方法，其中，该方法包括以下方法步骤：接收被分配了不同数据源的不同数据流；为每个数据流生成一组属性；将标签分配给每组属性的属性，由此为每个软分配产生一个置信度值；标准化置信度值；并基于标准化的置信度值生成指示该现象的输出。

发明内容

因此，本发明的目的相应在于，提供一种用于自动处理数据标识符的方法，该方法使得能够识别相关的数据标识符和/或相关的并且与相应至少一个数据标识符关联的数据。

在此，作为与数据标识符关联的数据理解为利用变量名(数据标识符)直接描述的数据，以及间接地在这种意义上描述的数据。例如，如果特征数据类型用于相应的变量，并且例如能够评估数据类型的名称以识别可能的相关性，则存在间接的描述。例如，沿着组成的数据类型的层次结构也存在这种间接描述。首先，在该上下文中命名在将数据传输至云平台使用的数据类型“资产”和“方面”以及在IoT平台(以下称为IoT模型)的数据模型的范畴中使用的标识符和IoT设备信息。

根据本发明，上述目的借助于具有权利要求1的特征的用于自动处理数据标识符的方法来实现。在该方法的范畴中提出：将设置有数据标识符或与以上概述的意义上的数据标识符相关联的数据传输至云平台。在云平台的区域中，借助于分析单元至少实现数据和/或数据标识符的临时处理。分析单元的功能优选以软件的方式实现。分析单元包括至少一个功能单元。该功能单元或每个功能单元对传输至云平台的数据和/或关联的数据标识符进行分析。相应的功能单元根据分析的结果得出置信度值。该功能单元或每个功能单元因此将数据和/或关联的数据标识符作为输入值接收，并且作为分析的结果得出的置信度值是相应的功能单元的输出值。该置信度值或每个置信度值映射到总置信度值。在只有一个功能单元并且相应地只有一个得出的置信度值时，那么该置信度值就是总置信度值。在多个功能单元的情况下，通过汇总、特别是以数字或逻辑的形式汇总各个功能单元的置信度值产生总置信度值，例如通过形成各个功能单元的置信度值的平均值(以数字的形式汇总)。总置信度值对两个数据标识符的相关性进行编码，例如，利用在从“0.0”至“1.0”值范围内的数值，其中，“1.0”编码自动确定的绝对相关性。作为相关地或作为足够相关地得出的数据标识符被汇总到上级变量名下，或将数据标识符添加到已存在的汇总中。该上级变量名能够用于作为数据库查询的关键字，该数据库查询提供有关在上级变量名下汇总的所有数据标识符的数据。在此，具有在预定的或可预定的阈值之上的总置信度值的数据标识符是相关的。

转移到开始时选择的具有性能数据的实例，该性能数据例如与“功率”和“性能”之类的数据标识符相关联，这意味着借助于至少一个功能单元得出性能数据和/或数据标识符的相关性，使得该相关性由至少一个置信度值和产生的总置信度值表示，使得数据标识符被汇总到以上级变量名(例如“功率”或“设施功率”)下，并且使得在利用该上级变量名进行数据库查询时可提供关于所有汇总到该上级变量名下的数据标识符的数据。因此，利用例如“设施功率”的数据库查询将提供与数据标识符“功率”相关联的、以及与数据标识符“性能”相关联的数据。如果不同但相似或至少原则上相似的设施利用这些数据标识符提供其功率数据(传输至云平台)，则利用在此提出的方法会自动识别其相关性，并且自动识别的相关性能够例如用于例如数据库查询。这又能够用于自动创建关于相应的设施的设施性能的组合概览。

本发明的优点主要在于，能够自动地或至少部分自动地识别所描述的相关性。如果不能够实现完全自动识别，例如由于总置信度值不足以进行可靠的自动识别，则能够以对人类专家容易检测的方式和方法，例如通过屏幕上的输出对所考虑的数据和/或关联的数据标识符进行比较。然后，专家能够做出有关相关性的最终决定，并确认或否定相关性。即使在这种首先通过人类专家的干预确认相关性的情况中，也将相应的数据标识符汇总到上级变量名下，或者将数据标识符添加到已存在的汇总中。

本发明的另一优点在于，通过汇总到上级变量名下，使得能够对被识别为相关的数据进行汇总访问。因此，能够实现自动生成图表，该图表以共同的视图并在共同的时间轴上示出不同但相似类型的设施(尤其是空间上远离的设施)的被识别为相关的数据。

在此提出，具有高于预定的或可预定的阈值(例如在从“0.0”至“1.0”的值范围的情况下为“0.9”)的总置信度值的数据标识符是相关的，也就是自动识别为相关的。相应地，具有低于预定的或可预定的阈值(例如在从“0.0”至“1.0”的值范围的情况下为“0.5”)的总置信度值的数据标识符能够作为不相关而被自动丢弃。在具有极限值与阈值之间的总置信度值的数据标识符的情况中，能够可选地自动触发用于确认它们是否相关的用户查询。

上述目的也借助于一种用于执行在此和在下文中描述的方法的设备来实现。该设备是能够在所谓的云中访问的计算机，或者是具有云平台和在那里加载的分析单元的计算机系统，如此处和下文所述。

分析单元和由其包括的功能单元或每个功能单元优选以计算机程序、或者分布式计算机程序的形式实现用于自动实施。在这方面，本发明一方面是具有能够通过计算机实施的程序代码指令的计算机程序，另一方面是具有这种计算机程序的存储介质，即具有程序代码构件的计算机程序产品，以及最后是能够在云中访问的计算机或计算机系统，在其存储器中加载或者可加载用于执行该方法及其设计方案的作为构件的计算机程序。

当在下面描述方法步骤或方法步骤顺序时，则这涉及基于计算机程序或在计算机程序的控制下进行的动作，除非明确指出单个动作是由计算机程序的用户发起的。术语“自动的”的每次使用至少意味着涉及的动作是基于计算机程序或在计算机程序的控制下进行的。

代替具有单独的程序代码指令的计算机程序，也能够以固件的形式实现在此以及下面描述的方法。对于本领域技术人员显而易见的是，代替在软件中实现方法，总是能够在固件中或在固件和软件中或在固件和硬件中实现方法。因此，应该适用于在此给出的描述，使得由术语软件或术语计算机程序也包括其他实现可行性，即特别是在固件中或在固件和软件中或在固件和硬件中的实现。

为了进一步描述，关于本发明的不同方面(用于自动处理数据标识符的方法；用于利用该方法的实现自动处理数据标识符的设备；具有该方法的实现的计算机程序)为了避免不必要的重复，结合所提及的用于自动处理数据标识符的方法以及描述可能的设计方案的特征和细节自然也适用于关于执行该方法而设置的设备，并且反之亦然。因此，该方法也能够借助于与该设备实施的方法步骤有关的单个或多个方法特征来开发，并且该设备也能够相应地通过构件、特别是用于实施在方法的范畴中实施的方法步骤的软件功能单元(程序代码构件)来开发。因此，结合所提及的用于自动处理数据标识符的方法和可能的设计方案所描述的特征和细节自然也与旨在执行该方法的设备相关地适用，并且反之亦然，因此关于本公开，总是相互引用或能够应用本发明的各个方面。

本发明的有利的设计方案是从属权利要求的主题。在此，权利要求书中使用的引用关系由相应从属权利要求的特征指明了相关权利要求的主题的进一步改进方案。它们不应理解为放弃对从属权利要求的特征或特征组合进行独立、客观的保护。此外，在权利要求和说明书的解释方面，在从属权利要求中的特征的更详细的具体化时，必须假设在相应的前述权利要求和该代表性的方法/代表性的设备的更一般的实施例中不存在/没有给出这种限制。因此，即使没有特殊指示，说明书中对从属权利要求的各方面的任何引用都应明确地理解为对可选特征的描述。

在该方法的另一个实施方式中，提供了不同的功能，即一个或每个功能单元的分析功能。在分析单元具有刚好一个功能单元的情况下，它既能够用作语音分析功能单元、统计分析功能单元、频谱分析功能单元、相关性分析功能单元、聚类分析功能单元或作为上下文分析功能单元。然后，能够仅由一个功能单元实现分析单元，能够预期该功能单元能够最好自动识别上述类型的可能相关性。

在该方法的一个有利的实施方式中提出，分析单元包括至少两个不同的功能单元。当一个分析单元具有一个以上的功能单元时，则每个功能单元能够执行不同的分析功能，并且分析单元然后包括以下功能单元组中的不同功能单元：语音分析功能单元、统计分析功能单元、频谱分析功能单元、相关性分析功能单元、聚类分析功能单元和上下文分析功能单元。通过两个或更多不同的功能单元识别的相关性是实际的相关性的更强有力的指示。因此，能够通过使用附加的功能单元来改进分析结果。

由于多个置信度值汇总成一个总置信度值而改进的总置信度值(与仅基于一个置信度值的总置信度值相比有所改进)能够选择地进行标记(注释)。借助于这样的注释，能够自动识别出总置信度值是基于正好一个功能单元的刚好一个置信度值还是基于至少两个功能单元的多个置信度值。例如，分配给总置信度值的附加的日期能够考虑作为注释。该附加日期能够是二进制日期，并且然后编码总置信度值是基于刚好一个置信度值还是至少两个置信度值。附加的日期也能够是以数字或其他方式枚举编码总置信度值所依据的置信度值的数量的日期，例如基于正好为三的置信度值“3”、“***”等。

在用于基于至少两个不同功能单元的使用来自动处理数据标识符的方法的优选实施方式中，能够激活或停用至少两个功能单元中的至少一个。这种激活或停用意味着相关功能单元仿佛是能够打开的。通过能够激活或停用各个功能单元，因此能够专门针对待处理的数据和/或数据标识符调节分析单元的分析功能。由此能够改进分析结果的质量。

在用于基于至少两个不同功能单元(其中的至少一个能够被激活或停用)的使用来自动处理数据标识符的方法的优选实施方式中，根据预定的或者可预定的激活方案实现一个功能单元或各个功能单元的激活或停用。当分析单元利用两个以上的可单独激活或停用的功能单元实现时，这种激活方案特别有用。通过使用这种激活方案，不必选择每个单独的功能单元进行激活或停用。而是激活方案的使用导致其中被编码的各个功能单元的自动激活，并且还导致不需要的功能单元的自动停用。这样的激活方案能够创建并保持用于不同的应用情况。根据应用情况选择激活方案。该选择由人类专家定期进行，其中，也能够考虑自动选择，例如针对首先分析的数据标识符和/或与其相关联的数据的选择。

在多个可单独激活的或可停用的功能单元的情况下，该方法的有利的实施方式提出，激活方案还为一个或每个待激活的功能单元编码激活序列和/或激活时间点。这允许对分析单元及其包括的功能单元的资源需求(特别是计算能力和/或存储容量)进行有针对性的控制。例如能够提出，首先例如在在线处理期间仅激活一个功能单元，或者仅激活几个功能单元，以获得关于可能的相关性的第一结果。之后，例如在离线处理期间，能够激活另外的功能单元或其他功能单元，以便根据情况确认或丢弃结果。

在多个功能单元，特别是多个可单独激活或可停用的功能单元的情况下，该方法的有利的实施方式提出，根据预限定或可预限定的映射方案，将每个功能单元或每个激活的功能单元的置信度值映射到总置信度值上。由此产生的优点是，使得能够分别关于相应的功能单元或激活的功能单元形成总置信度值。因此，能够通过相应的映射方案来考虑不同的功能单元或不同的激活的功能单元，尤其是由此相应地获得的置信度值的不同的相关性，例如具有用于各个置信度值的不同的权重因数的映射方案。

附图说明

下面参照附图更详细地解释本发明的实施例。在所有附图中，彼此对应的对象或元素具有相同的附图标记。

该实施例不应被理解为对本发明的限制。而是，在本公开的范畴中，绝对能够进行补充和修改，特别是那些对于本领域技术人员在实现该目的方面能够获得的例如通过组合或修改说明书的一般或特殊部分中所描述的并且包括在权利要求和/或在附图中获得的单个特征或方法步骤的补充和修改，并通过可组合的特征得出新的主题或新的方法步骤或方法步骤序列。

图中示出：

图1显示了几个将数据传输至云平台的设施，

图2示出了在数据传输至云平台时使用的数据结构，该数据结构具有变量名形式的数据标识符，

图3示出了云平台包括的并且用于处理和分析输入数据的分析单元，

图4示出了来自图3的分析单元的更多细节，即由分析单元包括的功能单元以及用于具体激活和停用各个功能单元的可选的激活方案，

图5示出了输入数据和/或数据指示符之间的得出的相关性的表格图示，

图6示出了相对于图5的图示得出的相关性的替代的图示。

具体实施方式

图1中的图示(示意性大大简化地)示出了不同自动化的或至少部分自动化的技术设施10或装置(在下文中统称为设施10，而不放弃进一步的一般普遍性)。所示的设施10是相同或至少原则上相同的设施10。所示类型的设施10的实例是冲压生产线、组装设施，(燃气)涡轮机设施、风电场或风力发电设施等。各个设施10例如位于不同的地理位置。作为上述类型的设施10，也能够考虑“移动”设施10，例如轨道交通车辆或这种轨道交通车辆的驱动单元。

明确指出，给出的实例不是穷举性的。原则上，这里提出的方法能够用于任何自动化的或至少部分自动化的技术设施10。

为了进一步描述，在不放弃任何进一步的一般普遍性的前提下，假定图1所示的每个设施10代表具有相应的至少一个风力发电设施的风电场。

为了集中监视前述类型的多个设施10或为了从前述类型的设施10集中检测数据的目的，当今，每个这样的设施10原则上以自身已知的方式和方法将数据、特别是传感器数据12传输至能到达所谓的云14的云平台16，即能够在云14中到达或者分布的计算机系统18。

传感器数据12基于原则上自身已知的、并未示出的并且在相应设施10的自动化的范畴中使用的传感器设施的测量值等。传感器数据12还能够从这样的测量值中导出，并且例如在相应设施10的自动化的范畴中以计算结果或处理过程的形式给出。传感器数据12包括例如状态信息、数量信息、统计信息、信号过程等。状态信息例如是相应的设施10或设施部件的状态或为使相应的设施10自动化而设置的自动化硬件或自动化硬件的一部分的状态。数量信息能够例如是消耗量或生产数量。组装设施的数量信息能够是安装的构件数量或生产的单元。统计信息能够包括例如上述类型的数量信息、或者能够将这种数量信息与确定的时间段有关。统计信息的其他实例是与设施或设施部件的运行时间有关或与(故障相关、维护相关等)停机时间有关的信息。

这样的或类似的传感器数据12到达云平台16并在那里被集中检测。由于经常以连续或大致连续形式到达的传感器数据12，尤其以所谓的时间序列形式的传感器数据12产生大量的数据。在借助于同一云平台16监视多个设施10的情况下，产生对应于设施数量的增加的数据量。

这种传感器数据12至云平台16的传输借助于设施10的相应的控制软件与云平台16之间的接口实现。这种接口功能本身是已知的。申请人使用的云平台16以名称“MindSphere”所公知，并且包括用于控制软件的接口功能。

下面的描述继续使用MindSphere的实例并且在那里引入的术语。然而，这决不应该被解释为限制，并且本质上是为了使下面的描述有更好的可读性。其他IoT平台和在那里可能使用的不同的术语始终一同阅读。在下文中，使用术语“MindSphere”代替术语“云平台16”，并且与术语云平台16同义。相应地，之前为术语云平台16引入的附图标记也用于术语MindSphere。每当提及术语MindSphere 16时，必须始终一同阅读更通用的术语云平台16。MindSphere 16是最广义的数据库，并且传感器数据12等包括在其中。借助于在此提出的方法实现的查询也与数据库有关。

利用MindSphere 16进行的数据检测和数据提供基于所谓的资产和方面。资产能够是或描述为设施10的任意元件或完整的设施10，例如泵、马达、SPS、完整的机床、生产线、机器人、起重机、行驶工具、风力发电设施等，仅举几个例子。MindSphere 16中的虚拟资产能够属于此类(物理)资产。数据点属于物理资产，例如，通过为泵分配多个提供相应传感器数据12的传感器。为了借助于MindSphere 16监视设施10，将至少单个物理资产的数据点限定为数据源，并将物理资产的数据源分配给MindSphere 16中的资产(虚拟资产)。

在相应设施10的层面上，传感器数据12等以不同的变量的当前值的形式存在，这些变量原则上以本身已知的方式在用于使设施10自动化的控制软件中创建。这些是借助于MindSphere 16访问的数据点。

在MindSphere 16中，资产是设施10或设施10的一部分的数字表示，例如设施10中的机器，或具有与MindSphere 16连接的一个或多个自动化设备(例如PLC)的自动化系统。

所谓的方面是资产的数据建模机制。方面基于数据点的逻辑、空间和/或功能分配对数据点进行分组。实例：泵组(资产)具有能耗(方面)，数据点“功率”、“电流”、“电压”等属于该能耗。该方面是借助于在技术术语中称为资产管理器的计算机程序限定的，能够自由选择其名称，但是应该具有至数据点和/或相应资产的连接。一个方面能够由多个变量构成，并且每个变量都借助于资产管理器与数据源连接(“数据映射”)。

图2中的图示示出了风力发电设施的方面20的实例。风力发电设施包括发电机。为此，在MindSphere 16中创建了一个方面20。该方面以单个变量22的形式汇总了发电机的属性，例如转速(“转速(RotationSpeed)”)和产生的电压(“电压(Voltage)”)。每个变量22具有数据类型(在此为“int”或“double”)。能够为每个变量22分配一个单位(此处的“rpm”用于转速，“V”用于电压)。每个变量22与一个数据点链接。该链接仅借助于链接符号24象征性地示出。链接的特定公式(“映射”)能够如下所示：“AnlageXY.AggregatXY.DatenpunktXY.Drehzahl”。在此，“AnlageXY”等是作为自动化项目中专门使用的标识符的一个实例的标识符。在风力发电设施或风力涡轮机的情况下，链接例如能够是：风力涡轮机1.发电机1.性能.转速。

基于具有资产和方面20的数据模型，在相应的设施10中实现数据检测，以及将数据12、即源自各个数据源和数据点的数据12传输至MindSphere 16。然后，传输的数据12在MindSphere 16内或由MindSphere16提供以用于进行进一步的处理和评估。

数据12与至少一个数据标识符20、22相关联。在所示实例中，变量22的名称和方面20的名称作为数据标识符20、22。通常，源自相应的IoT数据模型的名称(变量名、类型名称、方面名称、资产名称)或IoT设备信息被作为数据标识符20、22。

MindSphere 16以尤其未经格式化的数据流30(图3)的形式接收数据12，例如以所谓的键值对的形式、即以相应地设置有数据标识符20、22的日期12的对的形式接收数据。在此，一个以上的数据流30能够来自每个设施10，例如，一个数据流30来自每个数据源，或者一个数据流30来自每个数据点。至少一个数据流30至少来自每个设施10。在图3的图示中，以实例的方式示出了三个数据流30。每个数据流30例如源自图1所示的设施10之一。每个数据流30包括例如作为数据12的转速数据。数据流30包括的数据12的类型无法自动直接识别。为此，每个数据流30或由其包括的数据12与至少一个数据标识符20、22相关联。在足够清晰的数据标识符20、22的情况下，例如能够以合适的方式汇总设施10的转速数据，从而能够创建汇总的概述。

然而，恰恰常常没有给出数据标识符20、22的这种唯一性。数据标识符20、22通常以各自的本国语言被使用。除了开头使用的实例外，还能够使用转速数据的实例示出。能够考虑以不同的语言以不同的单词或表达作为此类转速数据的标识符(德语：“转速(Drehzahl)”；英语：“revolution speed”，“rotational frequency”或“speed”；法语：“nombre de tours”，“fréquence de rotation”或“vitesse”)和/或缩写(“rev”，“rot”等)。

这是由于，尤其具有空间分布的设施10的大型工业项目、特别是位于不同国家/地区的设施10，是以特定于客户和/或特定于国家的配置创建的，因此产生具有不同名称(命名)的数据12并发送至MindSphere 16(云平台16)。这导致了这样的问题，即，这些数据12只有利用大的人工花费才能够在更高级别的评估中被换算或转换为统一的变量。这就是本发明的出发点。

根据在此提出的方法，在MindSphere 16中设置有分析单元32，该分析单元至少暂时分析每个数据流30。分析单元32以软件地方式实现并且在图4的图示中进一步示出。

然后，分析单元32包括至少一个功能单元40-50，借助于该功能单元对输入的数据流30或多个输入的数据流30进行分析。在所示的、原则上可选的设计方式中，分析单元32包括多个单独的、独立的功能单元40-50，利用这些功能单元分别对输入的数据流30和其中包括的数据12进行特定的分析。从最广泛的意义上讲，每个功能单元40-50比较至少两个数据流30的数据标识符20、22和/或与之相关数据12，并且在每个功能单元40-50的输出处，将下面描述为置信度值的参量表示为分析结果。置信度值在此进行编码，即能够以何种概率假设，使得分析的数据流30和它们所包括的数据12在主题技术方面相关。例如，当数据12分别表示相同的或可比较的单位(例如风力发电设施的发电机)的转速、或相同的或可比较的单位的温度(即例如反应容器的温度)等时，就是这种情况。

置信度值的编码原则上是任意的。考虑使用以百分比进行编码，例如从“0％”至“100％”的值，具有从“0.0”至“1.0”的值的编码或根据序数标度的字母数字形式的编码。下面，为了获得更好的可读性但又不放弃任何进一步的一般普遍性，根据利用从“0.0”至“1.0”的值表示的置信度值来继续进行描述。在此，置信度值为“1.0”意味着能够假设分析的数据流30和其中包括的数据12以上述方式和方法在主题技术方面是相关的。置信度值为“0.0”相应地意味着，在所分析的数据流30与它们所包括的数据12之间不能确立这样的主题技术方面的关系。

功能单元40-50能够优选单个地被激活和停用。仅激活的功能单元参与分析。在分析单元32的特殊的实施方式中提出，各个功能单元40-50能够以预定的或可预定的顺序(顺序的序列)被激活并且在分析单元32运行时以相应的顺序被激活。下面描述各个功能单元40-50：

第一功能单元40关于由数据流30包括的数据标识符20、22或以其他方式分配给数据12或数据流30的数据标识符20、22(例如根据IoT数据模型或基于IoT设备信息)执行语言分析。因此，第一功能单元40也能够被称为语音分析功能单元40。借助于该功能单元40自动地(例如借助于至少一个电子词典)识别出例如“转速(Drehzahl)”，“revolution speed”，“rotational frequency”或“speed”；“nombre de tours”，“fréquence de rotation”或“vitesse”，“rev”，“rot”等的标识符表示一个或者同一标识符，即转速。因此，自动识别出由数据流30包括的数据12是转速数据并且数据流30和由其包括的数据12的相关性能够被存储。

在特定的、然而仍然实例性的情况下，例如，数据流30之一与数据标识符20、22“转速”相关联，并且另一数据流30与数据标识符20、22“fréquence de rotation”相关联。借助于第一功能单元40自动识别两个数据标识符20、22在语言方面的相等性。然后输出值“1.0”作为置信度值。这由此得出，即在假定的实例中，两个数据标识符20、22都包括在与数据流30关联的拼写方式(例如电子字典中)中，该电子字典由功能单元40进行访问。如果拼写方式不同，例如“frequence de rotation”而不是“fréquence de rotation”，则不再给出绝对相等性。这将自动在置信度值中考虑。然后，输出例如为“0.95”的置信度值。以此方式，还能够评估与数据流30关联的数据标识符20、22，其不包括在电子词典中，例如“frequencede rotation”或“fre de rotation”等。

第二功能单元42对数据流30包括的数据12进行统计分析，并因此也能够称为统计分析功能单元42。该功能单元42考虑由数据流30包括的数据12并得出例如最小值、最大值、平均值、标准偏差和/或频率分布等。借助于该功能单元42，能够自动地将为相应的数据流30得出的一个或每个统计变量与为另一个数据流30得出的相应的统计变量进行比较。根据统计变量之间的对应关系，在该功能单元42的输出处得出置信度值。例如，如果在两个数据流30的情况下，它们所包括的数据12具有相同的最小值和相同的最大值，输出“1.0”作为置信度值。在统计变量的不完全匹配的情况下，其在置信度值中相应地考虑这点。得出的统计值彼此之间的差异越大，置信度值就越低。

第三功能单元44对由数据流30包括的数据12进行频谱分析，并且因此也能够称为频谱分析功能单元44。该功能单元44还考虑由数据流30包括的数据12，并且例如相应地借助于FFT(快速傅立叶变换)得出由数据流30包括的数据12的频谱分量。其在接下来的步骤中彼此进行比较，并且根据一致性的程度得到置信度值，即置信度值越高，一致性程度越高。

第四功能单元46对由数据流30包括的数据12进行相关性分析，因此第四功能单元46也能够被称为相关性分析功能单元46。例如，该功能单元46还查看数由数据流30包括的数据12，并且借助于互相关函数(KKF)来得出由数据流30包括的数据12的序列的相关性。基于互相关函数的结果得出置信度值。

第五功能单元48对数据流30所包括的数据12进行原则上已知的所谓的聚类分析，并因此也能够称为聚类分析功能单元48。该功能单元48还考虑由数据流30包括的数据12。基于每个数据流30及其数据12产生至少一个簇。功能单元48得出该簇并比较它们，例如关于它们的位置、形式和/或范围。基于描述得出的簇的此类特征参数的数值，能够实现对得出的簇进行比较。置信度值取决于得出的簇关于此类的或相似的特征参数的一致性程度。

第六功能单元50执行上下文分析，并因此也能够称为上下文分析功能单元50。该功能单元50本身包括至少一个另外的功能单元52-58。在所示的实施例中，上下文分析功能单元50以原则上可选的方法和方式包括多个能够单独激活和停用的其他功能单元52-58。一个或每个另外的功能单元52-58如上所述输出置信度值。激活的另外的功能单元52-58的置信度值被汇总成上下文分析功能单元50的置信度值。

第一另外的功能单元52关于MindSphere 16中的数据传输中所涉及的资产类型或方面类型的关系进行上下文分析。如果类型(数据类型)一致，则给出较高的相关性，并且会产生相应的置信度值。

第二另外的功能单元54关于以下因素中的至少一个进行上下文分析：设备的类型(设备类型)，其中，数据12所源自的数据点被分配给该设备；用于传输数据12的协议(数据协议)；具有数据点和/或分配给设备的传感器的设备位置。关于每个考虑的因素能够得出一致性的程度。例如，如果发现两个数据流30分别来自相同类型的设备，则存在高度的一致性和相应的置信度值。如果检查多个因素(例如设备类型和数据协议)，并且关于这些因素得出高度一致性，则给出较高的置信度值。实际置信度将取决于，同时正在测试或能够测试多少个因素，并且关于一个或每个测试因素得出何种程度的一致性。

第三另外的功能单元56关于采样率进行上下文分析，其中，数据12利用该采样频率到达相应的数据流30中。如果相同的或原则上相同的采样频率的情况下，则会产生高置信度值。得出的采样率彼此偏离得越远，该另外的功能单元56输出的置信度值就越低。例如通过如下方式获得采样率，即，由数据流30包括的数据12设置有时间戳，从而能够根据两个这样的时间信息之间的差来得出采样率。用于得出采样率的另一种可能性是，例如，MindSphere 16中的数据传输所涉及的资产类型或方面类型的限定、或通常是IoT数据模型包括采样率的规范，使得能够在那里从该另外的功能单元56读出相应的值。

第四另外的功能单元58关于变量22(图2)的数据类型和/或与MindSphere 16中的数据传输有关的资产和方面20的变量22的标识符进行上下文分析。关于通过该另外的功能单元58检查的一个或每个因素的高度一致性导致相应高的置信度值。

第一数据流30的数据12和至少一个另外的数据流30和/或至少一个相应的数据标识符20、22的数据12的分析能够同时进行或在时间上依次进行。在非同时分析的情况下，例如存储数据标识符20、22，并且例如借助于语音分析功能单元40与稍后得出的另外的数据流30的数据标识符20、22和/或其中包括的数据12进行比较。例如，如果得出关于由数据流30包括的数据12的统计特征值，则同样适用，这些特征值被临时存储，直到与之后得出的另外的数据流30的统计特征值进行比较(例如借助于统计分析功能单元42)。

取决于例如根据激活方案62(图4)激活了哪个功能单元40-50以及可能激活哪个另外的功能单元52-58，自动获得相应的多个置信度值。这些被精确地映射到一个置信度值(总置信度值60)，例如通过形成平均值或者通过形成利用各个加权因子加权的平均值。

可选地，在此，总置信度值60的形成所基于的映射方案64(图4)取决于激活的功能单元40-50、52-58的类型和数量。默认的映射方案能够设置例如给每个功能单元40-50分配一个加权因子，以便总置信度值60是各个置信度值与各个加权因子的乘积之和除以激活的功能单元40-50的数量。

依赖于单个功能单元40-50的激活的映射方案64(依赖于激活的映射方案)能够例如以如下方式提供单个功能单元40-50的置信度值的最大链接，使得激活的功能单元40-50的最大置信度值产生作为总置信度值60(对于只能够假设离散值“0.0”或“1.0”的置信度值，这对应于逻辑或链接)。当其他功能单元40-50被激活时，依赖于激活的映射方案64能够提供各个置信度值的其他链接形式，例如使得总置信度值60被给出作为激活的功能单元40-50的各个置信度的平均值，或者例如使得总置信度值60基于激活的功能单元40-50的各个置信度值的至少一个逻辑链接(例如至少一个如果然后链接(Wenn-Dann-Verknüpfung))被给出。在此，能够考虑并且有利地使用不同的变体方案(可能也能够彼此组合)。例如，在两个或更多个激活的功能单元40-50的情况下，其中，激活的功能单元40-50之一被期望具有特别有说服力的置信度值，例如来自语音分析功能单元40的置信度值，其权重高于其他激活的功能单元40-50的置信度值。基于相应的逻辑链接实现公式或形成规则的选择和应用，即特定的映射方案，以得出具有较高置信度值加权的总置信度值60。替代地或附加地，能够借助于相应的逻辑链接来检测，如果另一第一功能单元40-50的置信度值在特定值范围内，禁止或不必要考虑另一功能单元40-50或200的置信度值，或需要对该置信度值进行更高或更低的加权。

为了有针对性地激活和停用各个功能单元40-50以及可能其他功能单元52-58，在分析单元32可访问的存储器中创建至少一个激活方案62(图4)，以便分析单元32访问用于自动激活和停用各个功能单元40-50、52-58的分析单元。激活方案62(例如以二进制掩码的形式或以二进制掩码的形式)确定哪些功能单元40-50、52-58是激活的或停用的。然后，这些掩码中的日期的位置确定哪个功能单元40-50、52-58与激活或停用有关。例如，像“100001”这样的掩码表示激活第一功能单元40和第五功能单元50，而其他功能单元42-48被停用(相应地适用于其他功能单元52-58)。分析单元32读取这样的激活方案62，并且根据激活方案62来执行各个功能单元40-50的激活和停用。

在激活的功能单元40-50的预定的或可预定的顺序序列的情况下，激活方案62还包括各个功能单元40-50的激活序列。

对于(如在此提出的方法的特定的实施方式中以基本可选的方式和方法提供的那样)总置信度值60的形成取决于激活的功能单元40-50、52-58的类型和数量的情况，在分析单元32访问的存储器中创建至少一个映射方案64(图4)，分析单元32为了自动形成总置信度值60而访问该存储器。

分析单元32和由其包括的一个或每个功能单元40-50、52-58优选以软件的方式实现，并且图4中的分析单元32的图示相应地是实现(具有一个或每个功能单元40-50、52-58的)分析单元32的功能的计算机程序的示意性简化图示如果可能，可能附加地包括用于评估至少一个激活方案62和/或至少一个映射方案64的功能的实现。

相应地，计算机系统18(图1)，特别是具有至少一个处理器和存储器的已知计算机系统18，在该存储器中加载了这样的计算机程序，并且在计算机系统的运行期间执行该计算机程序。是具有在此描述的本发明的实现的设备的实例。

借助于分析单元32对两个数据流30和由它们包括的数据12的分析结果是总置信度值60，该总置信度值60表示数据流30、由它们包括的数据12和/或相应的数据标识符20、22的相关性。结果能够以表格的形式被示出，例如以表格的形式被示出，如图5中的图示所示。结果的替代表示在图6的表示中以树(图表、本体)的形式示出。

在图5的表格和图6的图表中，文本“Va”、“Vb”、“Vc”和“Vd”代表任意变量22(图2)，并且文本“K1”、“K2”和“K3”代表相应的关于具有这些变量22的数据12的数据流30得出的总置信度值60。在总置信度值60高于预定或可预定的阈值(例如“0.8”)的情况下，相应的变量22以上面概述的方式相关。在总置信度值60高于预定或可预定的阈值(例如“0.5”)，但低于阈值的情况下，能够手动将变量22标记为以上面概述的方式相关。相关的变量22借助于上级变量名66表示为相关。这将自动地通过分析单元32根据数据12的类型或者根据变量22的标记来产生，(例如在分析时观察到的第一变量22)。上级变量名66在图5和图6的图示中象征性地显示为“Drhz”，其中，该文本应该代表单词“转速”，并且由于分析数据12是转速数据而获得。

可选地，映射方案64或者激活方案62还包括极限值和/或阈值的动态适配。这样的匹配例如基于预定的或可预定的极限值和阈值，例如阈值“0.8”和极限值“0.5”而实现。然后，例如在提供激活功能单元40-50的激活方案62的情况下，该功能单元的置信度值关于两个变量22的相关性特别有说服力，能够在动态适配方面降低阈值，例如降低“0.1”，因为例如在大于或等于“0.7”的置信度值的情况下，就已经能够为特别有说服力的置信度值自动识别相关性。相反，在功能单元40-50的置信度值不太有说服力的情况下，能够通过动态调整来提高阈值，因为在说服力不大的置信度值的情况下需要较高的置信度值，因此能够自动得推断出相关性。这适用于极限值的自动动态匹配。

上级变量名66允许访问被得出为相关的变量22。例如，利用上级变量名66能够对MindSphere 16中可用数据制定搜索，并且在评估相应的搜索字符串时，将上级变量名66自动地转换成汇总到该上级变量名下的并且识别为相关的变量22。然后，将搜索字符串(例如“FIND Drhz”)相应地自动转换为搜索字符串(例如“Find Va、Vb、Vc、Vd”)。由此，能够从MindSphere 16的数据库中检索得出的变量22的当前值和/或历史值，并且利用检索的值能够例如产生不同的风力发电设施(设施10)的转速数据的对照。一般而言，制定意味着，使得得出的上级变量名66能够用于作为数据库查询(即MindSphere数据库中的查询)中的关键字。

结果，基于先前借助于分析单元32先前的分析，能够借助于标识符(上级变量名66)集中访问相关的数据，而不管数据12、变量22或在MindSphere 16中数据传输时所涉及的资产和方面20最初是如何描述的。

在这里提出的方法的一个有利的实施方式中，在初始的第一得出之后，根据在此期间添加的数据12，不时地例如在预定或可预定的时间点或者以预定或可预定的时间间隔再次得出总置信度值60(如其在图5中所示的那样)。然后，能够得到相比于之前得出的总置信度值60不同的总置信度值60，并且这导致根据相应的产生的新置信度值60的先前存在的对上位变量名66的分配或对上位变量名66的新分配的消除。

尽管已经通过实施例更详细地示出和描述了本发明，但是本发明不限于所公开的实例或示例，并且本领域技术人员能够在不脱离本发明保护范围的前提下得出其他变体方案。

因此，能够将在这里提交的描述的各个方面简要地概括如下：首先，说明了一种用于自动处理数据标识符20、22的方法。与数据标识符20、22关联的数据12被传输至例如不同但相同类型的技术设施10的云平台16。云平台16包括具有至少一个功能单元40-50的分析单元32，并且该功能单元或每个功能单元40-50执行对传输至云平台16的数据12和/或关联的数据标识符20、22的分析。作为分析的结果，该功能单元40-50或每个功能单元40-50输出置信度值。该置信度值或每个置信度值映射到总置信度值60，该总置信度值对两个数据标识符20、22的相关性进行编码。被确定为相关的数据标识符20、22被汇总到上级变量名66下。上级变量名66能够用作数据库查询的关键字，该数据库查询因此提供有关在上级变量名66下汇总的所有数据标识符20、22的数据。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 自动处理数据标识符的方法、设备和计算机程序 [P] . 中国专利： CN112868217A . 2021-05-28
2. 一种数据同步中处理数据项标识符映射的方法、设备和系统 [P] . 中国专利： CN101552773B . 2012.08.22
3. METHOD, APPARATUS AND COMPUTER PROGRAM FOR THE AUTOMATIC PROCESSING OF DATA IDENTIFIERS [P] . EP3841732A1 . 2021-06-30

机译：用于自动处理数据标识符的方法，装置和计算机程序
4. METHOD, APPARATUS AND COMPUTER PROGRAM FOR AUTOMATICALLY PROCESSING DATA IDENTIFIERS [P] . US2021382882A1 . 2021-12-09

机译：用于自动处理数据标识符的方法，装置和计算机程序
5. FRAME IDENTIFIER ENCODING DEVICE, FRAME IDENTIFIER DECODING DEVICE, FRAME IDENTIFIER COMMUNICATION METHOD, AND COMPUTER PROGRAM [P] . 世界知识产权组织专利： WO2019155681A1 . 2019-08-15

机译：帧标识符编码设备，帧标识符解码设备，帧标识符通信方法和计算机程序