首页> 中国专利> 使用人工智能对物理动态系统执行建模和控制的系统和方法

使用人工智能对物理动态系统执行建模和控制的系统和方法

摘要

本公开提供用于控制对象的系统,方法和计算机程序产品。示例方法可以包括(a)获得对象的视频数据和(b)对视频数据执行运动分析以生成修改后的视频数据。该方法可以进一步包括(c)使用人工智能(AI)来识别修改后的视频数据中的一组特征。该组特征可以指示对象的预测状态。可以根据历史训练数据对AI进行离线训练。该方法可以进一步包括(d)使用预测状态来确定控制信号,以及(e)实时地将控制信号发送到对象以关于预测状态调整或维持对象的状态。可以在不接触对象的情况下执行操作(a)至(d)。

著录项

  • 公开/公告号CN112889090A

    专利类型发明专利

  • 公开/公告日2021-06-01

    原文格式PDF

  • 申请/专利权人 道特里斯艾欧公司;

    申请/专利号CN201980068615.9

  • 发明设计人 亚当·沃恩;

    申请日2019-08-15

  • 分类号G06T7/246(20170101);G06T7/269(20170101);G06K9/00(20060101);G06K9/32(20060101);G06K9/46(20060101);G06K9/62(20060101);

  • 代理机构11262 北京安信方达知识产权代理有限公司;

  • 代理人李健

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 11:11:32

说明书

本申请要求于2018年8月17日提交的美国临时专利申请号62/719,296的优先权,其全部内容通过引用合并于此。

背景技术

异常检测和预测性维护系统可能依赖于由传感器收集的数据,这些传感器直接连接到系统监视的对象。传感器可以包括加速度计,陀螺仪,麦克风,应变仪,温度计等。传感器可通过有线网络将数据传输到一个或多个计算设备。计算设备可以使用人工智能(AI)或机器学习(ML)算法处理数据,以生成输出,例如分类,预测和控制信号。AI和ML算法可以似乎是“黑匣子”算法,因为在它们处理数据时几乎无法洞悉它们在数据中“看到”的内容。

发明内容

本公开提供了用于确定对象的一个或多个特征,预测对象的未来状态以及控制对象(所有这些都无需接触它)的系统、方法和计算机程序产品。本文所述的系统可包括相机和在一个或多个位置的一个或多个适当编程的计算设备。相机可以被配置为捕获对象的视频,例如物理动态系统。动态系统可以是状态空间上时间演化的规则。物理动态系统可以是这种动态系统的物理实施方式,例如钟摆,水和管道以及鱼和湖。可以通过连续或离散时间的微分或差分方程来定义动态系统。动态系统可以是线性、非线性、非平稳、确定性、机会、随机和/或混沌的。

物理动态系统的一个示例是内燃机。发动机的输入可以是燃料和空气,并且发动机的输出可以是机械功。例如,发动机的时变状态可以由诸如发动机的温度和内部压力,其活塞的速度或加速度,其振动的频率,或者其在操作期间的应力或应变曲线的参数来定义。这些参数可以由动态系统建模。

一个或多个计算设备可以从相机获得对象的视频数据,并对视频数据执行运动分析或其他类型的分析(例如,颜色分析)以生成修改后的视频数据。对视频数据执行运动分析可以涉及识别,放大或以其他方式修改在视频数据中检测到的运动。例如,该系统可以输出修改后的视频数据,其中上述内燃机的振动被放大或以其他方式被扩大。放大振动可能会使(i)人类和(ii)进一步处理修改后的视频数据的算法都更容易察觉。

然后,一个或多个计算设备可以使用人工智能(AI)或机器学习(ML)算法来处理修改后的视频数据,以识别对象的特征或当前状态,预测对象的未来状态,或控制对象。例如,系统可以使用AI处理上述内燃机的修改后的视频数据,以将发动机的预测状态分类为最佳或次优。在次优分类的情况下,AI可以生成控制信号以尝试校正发动机的预测状态。例如,AI可以生成控制信号,其调整发动机中的阀门位置,以尝试实现不同的空燃比。

在某些情况下,可以例如在操作或主动使用期间实时地对AI执行自适应再训练,以优化其性能。再训练AI可能涉及使用历史离线训练数据和自适应在线训练数据的加权混合来优化算法的参数。

本公开中提供的系统可以监视物理动态系统而无需接触这样的物理动态系统。由于多种原因,这可能是理想的。第一,与物理动态系统直接接触的传感器在操作过程中(例如,在恶劣的环境中)可能趋于破裂或变得与物理动态系统断开。相反,本公开中提供的相机可以在物理上与物理动态系统分开,并且可以不受其操作的影响。第二,使用远程放置的相机可以减少为物理动态系统配备传感器和电线的费用和/或重量。第三,相对于较低的保真度点传感器测量,相机可以提供更高的系统动态保真度视图。第四,相机提供了气隙,该气隙可以减轻例如在物联网实现中第三方攻击物理动态系统的安全风险。

通过将运动分析与自适应再训练的AI相结合,本公开中提供的系统还可以对物理动态系统的未来状态做出更准确的预测。特别地,将运动分析用作预处理工具可以允许后续的AI对更高分辨率的数据进行操作。此外,AI可以将基于历史训练数据的广义学习传输到具有很少在线训练数据的新实验装置。运动分析(或颜色分析)和AI一起可以促进非线性,非平稳,随机和/或混沌物理动态系统的超快速预测和控制。使用非AI技术可能难以感测,建模和/或控制这样的物理动态系统。

本公开另外提供用于解释AI“看到”什么的系统,方法和计算机程序产品。如本文所述的系统可以包括相机;以及在一个或多个位置的一个或多个适当编程的处理设备;具有用户界面的用户设备。相机可以被配置为捕获对象的视频。一个或多个处理设备可以使用AI来处理视频,以生成识别对象特征的输出。输出例如可以是对象具有或正经历异常的预测。一个或多个处理设备还可以生成视频的增强派生(augmented derivative)。视频的增强派生可以是例如其中看不见的移动被放大的视频的版本。

此后,用户设备可以使用户界面显示输出,视频以及视频的增强派生。在同一用户界面中显示输出,视频和视频的增强派生以便用户同时查看,可以为用户提供在执行异常检测,状态预测和控制时AI“看到”的内容的洞察力。在某些情况下,原始的未增强视频可能会显示该对象正在按预期操作。但是,视频的增强派生可能绘制不同的图片。例如,将输出,视频和视频的增强派生一起呈现可以允许用户更容易地看到导致AI检测到对象异常的数据变化。

在一方面,本公开提供一种用于控制对象的方法。该方法可以包括:(a)获得所述对象的视频数据;(b)对所述视频数据执行运动分析,以生成修改后的视频数据;(c)使用人工智能(AI)来识别所述修改后的视频数据中的一组特征。所述一组特征可以指示所述对象的预测状态。可以已经根据历史训练数据对所述AI进行离线训练。方法还包括(d)使用所述预测状态来确定控制信号;和(e)将所述控制信号实时发送到所述对象,以关于所述预测状态调整或维持所述对象的状态。可以在不接触所述对象的情况下执行操作(a)至(d)。

在一些实施方式中,该方法可以还包括实时地自适应地再训练所述AI。自适应再训练可以包括使用加权最小二乘法来调整AI的一个或多个参数。自适应再训练可替代地包括使用监督学习过程来调整AI的一个或多个参数。自适应再训练可以包括使用历史训练数据和自适应在线训练数据的加权混合。

在一些实施方式中,操作(b)可以包括放大视频。放大视频数据可以包括使用视频加速度放大或欧拉视频放大中的一个或多个来处理视频数据。

在一些实施方式中,操作(b)可以包括使用基于相位的运动估计算法或对象边缘跟踪算法来处理视频数据。在一些其他实施方式中,操作(b)可以选择性地对所述视频数据中的一个或多个频率进行过滤。在一些其他实施方式中,操作(b)可以包括将所述视频数据分解为多个不同的空间比例和方位,并使用不同的计算机视觉或机器学习算法来处理所述多个不同的空间比例和方位中的每一个。使用不同的计算机视觉或机器学习算法来处理多个不同的空间比例和方位中的每一个可以包括在语义上分割多个不同的空间比例和方位。在一些其他实施方式中,操作(b)可以包括识别所述视频数据中的关注区域并对所述关注区域执行时间分析。

在一些实施方式中,对象可以包括物理动态系统或所述物理动态系统的模拟。可以将控制信号配置为使物理动态系统或物理动态系统的模拟执行动作。可以将控制信号配置为使物理动态系统或物理动态系统的模拟关闭。可以将控制信号配置为使物理动态系统或物理动态系统的模拟继续操作。

在一些实施方式中,该方法可以还包括实时发送警报或状态指示符,所述警报或状态指示符指示所述对象被预测为具有所述预测状态。

在一些实施方式中,所述一组特征可以包括所述对象的空间或时间特征。所述空间或时间特征可以包括对象的振动或移动。振动或移动可能是肉眼无法察觉的。空间或时间特征可以包括对象的颜色变化。

在一些实施方式中,对象可以是风力涡轮机、核反应堆、化学反应堆、内燃机、半导体制造系统、翼型、等离子体系统、生物系统、医学成像系统或金融交易系统的数据源。

在一些实施方式中,AI可以是深度神经网络、储层计算算法、强化学习算法或生成对抗网络。

在一些实施方式中,历史训练数据可以包括所述对象的视频数据或与所述对象相同类型的对象的视频数据。

在一些实施方式中,该方法可以还包括在操作(b)之前,从非相机传感器获得数据,并使用所述AI来处理来自所述非相机传感器的所述数据和所述修改后的视频数据以识别所述一组特征。

在一些实施方式中,预测状态可以是异常。异常可以是缺陷。该缺陷可以是结构缺陷。

在一些实施方式中,该方法可以还包括在操作(d)之前,确定对象的预测状态是否是次优的。

本公开的另一方面提供一种用于处理对象的视频以识别对象的特征的方法。该方法可以包括:(a)获得所述对象的所述视频;(b)使用人工智能(AI)来处理所述视频,以生成识别所述对象的所述特征的输出;(c)在用户的电子设备的用户界面上呈现所述视频的所述输出和增强派生。所述视频的增强派生可以在增强所述视频的一个或多个特征时生成。

在一些实施方式中,该方法可以还包括在用户界面上呈现视频。

在一些实施方式中,增强视频的一个或多个特征可以包括放大视频中对象的移动或振动。

在一些实施方式中,对象的特征可以是异常。

在一些实施方式中,输出可以包括关于对象的预测或分类。

在一些实施方式中,该方法可以还包括如果所述输出指示所述对象的次优未来状态,则使所述用户能够通过所述用户界面执行动作。在一些实施方式中,该方法可以还包括获得对象的附加视频;以及使用AI处理附加视频以生成关于对象的附加输出;并且在用户界面上呈现附加视频的附加输出和增强派生。

在一些实施方式中,呈现可以包括增强现实的使用。

在一些实施方式中,对象的特征可以包括对象的空间或时间特征。所述空间或时间特征可以包括所述对象的振动或移动。振动或移动可以是肉眼无法察觉的。所述空间或时间特征可以包括所述对象的颜色变化。

本公开的另一方面提供了一种方法,该方法可以包括:(a)获得对象的视频数据;(b)使用计算机视觉或机器学习算法处理视频数据,以识别对象的多个特征;(c)对于对象的多个特征中的每一个,将定义所述特征的数据和其中出现所述特征的所述视频数据的识别符与所述特征的语义描述符相关联地存储在数据库中;(d)提供用于所述数据库的搜索界面。搜索界面可以被配置为使用户能够至少使用所述特征的所述语义描述符来查询所述数据库,以访问所述视频数据。

在一些实施方式中,多个特征可以包括所述对象的振动频率,所述对象的颜色变化或所述对象的分类。

本公开的另一方面提供一种用于在不接触物理动态系统的情况下识别所述物理动态系统的特征的方法。该方法可以包括:(a)获得所述物理动态系统的视频数据;(b)对所述视频数据执行运动分析,以生成修改后的视频数据;(c)使用人工智能(AI)处理所述修改后的视频数据以识别所述物理动态系统的所述特征。可以已经根据历史训练数据对AI执行离线训练。

在一些实施方式中,物理动态系统的特征可以是物理动态系统的当前状态。在一些实施方式中,该方法可以还包括使用所述AI来至少部分地基于所述物理动态系统的当前状态来确定所述物理动态系统的预测状态。在一些实施方式中,该方法可以还包括:(d)使用所述预测状态来确定控制信号;以及(e)将所述控制信号实时发送到所述对象,以关于所述预测状态调整或维持所述对象的状态。AI可以是端到端强化学习算法。

本公开的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,该机器可执行代码在由一个或多个计算机处理器执行时,实现本文上面或本文其他地方的任何方法。

本公开的另一方面提供了一种系统,该系统包括一个或多个计算机处理器和耦合到其的计算机存储器。该计算机存储器包括机器可执行代码,该机器可执行代码在由一个或多个计算机处理器执行时实现本文上面或本文其他地方的任何方法。这样的系统可以还包括用于获得对象的视频数据的低延迟相机。系统中的一个或多个计算机处理器可以包括图形处理单元,专用集成电路或通用处理器。一个或多个计算机处理器可以是边缘计算设备或云计算设备。

通过下面的详细描述,本公开的其他方面和优点对于本领域技术人员将变得容易理解,其中仅示出和描述了本公开的说明性实施方式。将会认识到,本公开内容能够具有其他和不同的实施方式,并且其若干细节能够在各种明显的方面执行修改,而所有这些都不脱离本公开内容。因此,附图和描述本质上应被认为是说明性的,而不是限制性的。

本说明书中提及的所有出版物,专利和专利申请都以相同的程度通过引用并入本文,就好像每个单独的出版物,专利或专利申请被明确地并单独地指出通过引用并入一样。在通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相抵触的程度上,该说明书旨在取代和/或优先于任何此类矛盾的材料。

附图说明

在所附权利要求中具体阐述了本发明的新颖特征。通过参考下面的详细说明,可以更好地理解本发明的特征和优点,所述详细说明阐述了利用本发明的原理的说明性实施方式以及附图(也称为“图”),其中:

图1示意性地图示了异常检测系统。

图2是用于监视和控制物理动态系统的示例过程的流程图。

图3是用于处理修改后的视频数据以生成控制信号以控制物理动态系统的示例过程的流程图。

图4是用于解释AI“看到”什么的示例过程的流程图。

图5示出了“可解释的AI”用户界面的示例。

图6是用于提供视频搜索界面的过程的流程图。

图7示出了被编程或以其他方式配置为实现本文提供的方法的计算机系统。

具体实施方式

尽管在此已经示出和描述了本发明的各种实施方式,但是对于本领域技术人员容易理解的是,这些实施方式仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变化,改变和替换。应当理解,可以采用本文所述的本发明的实施方式的各种替代方案。

如本文所用,术语“人工智能”(AI)通常是指包括计算机模型或算法的机器智能,该计算机模型或算法可用于提供可操作的见解,做出预测和/或控制致动器。AI可以是机器学习算法。机器学习算法可以是训练的机器学习算法,例如,根据传感器数据训练的机器学习算法。可以使用监督的,半监督的或无监督的学习过程来训练这种训练的机器学习算法。机器学习算法的示例包括神经网络,支持向量机和强化学习算法。

每当术语“至少”,“大于”或“大于或等于”在一系列两个或更多个数值中的第一数值之前时,术语“至少”,“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3等于大于或等于1,大于或等于2或大于或等于3。

每当术语“不大于”,“小于”或“小于或等于”在一系列两个或更多个数值中的第一数值之前时,术语“不大于”,“小于”或“小于或等于”适用于该系列数值中的每个数值。例如,小于或等于3、2或1等于小于或等于3,小于或等于2或小于或等于1。

图1示意性地图示了异常检测系统100。系统100可以检测对象105中的异常并且在不接触对象105的情况下控制或执行对对象105的预测维护。对象105可以是物理动态系统或物理动态系统的模拟。物理动态系统可以是动态系统的物理实施方式。动态系统可能是状态空间上时间演化的规则。例如,物理动态系统可以是飞机机翼,其可以由数学函数来描述,该数学函数例如由于飞机机翼的振动而定义了空中机翼上一个或多个位置的时间依赖性。物理动态系统的模拟可以是代表物理动态系统的结构和功能的计算机模型。

对象105可以是能量产生或分配系统,例如,蒸汽发电机、水力发电机、核反应堆、风力涡轮机、太阳能板、配电线等。对象105可以是天然气井、天然气精炼厂、泵、压缩机或管道。对象105可以是电池或燃料电池。对象105可以是化学反应器。对象105可以是微流体系统。对象105可以是生物系统,例如,细胞培养物、植物、动物、人等。对象105可以是半导体制造系统,例如,光刻系统、蚀刻系统或沉积系统。对象105可以是制造系统。对象105可以是机器人系统。对象105可以是交通工具或交通工具的部件,例如,火箭、飞机或机翼、轮船或帆、火车、汽车、内燃机、电动机等。对象105可以是基础设施,例如,建筑物、道路、桥梁、隧道、铁路等。对象105可以是等离子体系统,例如,脉冲等离子体系统或核聚变等离子体系统。对象105可以是光源。对象105可以是用于金融交易系统,情绪状态检测系统(例如,谎言检测系统)或安全系统的数据源。

系统100可以具有相机110。相机110可以具有光学元件,包括快门、透镜、反光镜、滤光器和图像传感器。相机110可以被配置为捕获对象105的视频或图像。相机110可以通过将3-D图像投影到2D图像平面上来生成二维(2-D)彩色或灰度视频或三维(3-D)场景的图像。因此,2-D图像中的每个点可以对应于场景中的3-D空间坐标。

相机110可以是数字相机。相机110可以是专用设备,或者可以被集成到诸如运动设备,电子平板计算机,个人计算机等的计算设备中。相机110可以是低延迟相机。相机可以是高帧率相机,例如以至少约100帧每秒(FPS)、200FPS、300FPS、400FPS、500FPS、1,000FPS、5,000FPS、10,000FPS、50,000FPS、100,000FPS或更高的速率捕获视频的相机。在某些情况下,相机110可以是360度相机。

在某些情况下,相机110可以使用不同类型的成像设备代替。例如,相机110可以代替红外相机,雷达系统(例如,传统雷达系统或合成孔径雷达系统),磁成像系统,光检测和测距系统,望远镜,医学共振成像(MRI)扫描仪,计算机断层扫描(CT)扫描仪等。尽管本公开总体上涉及“视频数据”,但是本文描述的系统和方法也可以使用来自这些其他类型的成像设备和/或成像设备的组合的数据。

系统100可以具有计算设备115。计算设备115可以从相机110获取视频数据并处理该视频数据以生成输出。

计算设备115可以具有运动分析模块116。运动分析模块116可以处理来自相机115的视频数据以生成修改后的视频数据。特别地,运动分析模块116可以处理视频数据以识别,放大或以其他方式修改在视频中检测到的运动。例如,运动分析模块116可以生成修改后的视频数据,其中对象的振动被扩大或以其他方式放大。运动分析模块115对于照明的变化和噪声(例如,进入相机的接收场的不正确的对象)可以是鲁棒的。

计算设备115还可以具有推理引擎(inference engine)117。推理引擎117可以使用来自相机110的视频数据或来自运动分析模块116的修改后的视频数据来生成输出。输出可以是对象的一个或多个特征。对象的一个或多个特征可以定义对象的当前状态。对象的一个或多个特征可以是描述对象的参数或变量,例如,速度,加速度,振动频率,应力,应变,颜色或温度。替代地或附加地,输出可以是对象的未来状态的预测。替代地或附加地,输出可以是关于对象的预测状态是否是次优的确定。推理引擎117可以是被配置为运行AI,ML或计算机视觉算法的AI加速器。推理引擎117可以被配置为实时在线再训练这样的算法。

计算设备115还可以具有控制模块118。控制模块118可以接收来自推理引擎117的输出作为输入,并且作为响应,生成控制信号并将其发送到对象以控制其操作。控制信号可以被配置为关于对象的预测状态来调整或维持对象的状态。也就是说,例如,如果预测状态不理想,则控制信号可以被配置为调整对象的操作参数,以将对象的状态从预测状态移开。或者,例如,如果预测状态是最佳的或以其他方式令人满意,则控制信号可以被配置为维持对象的操作参数以保持对象接近于预测状态。

运动分析模块116,推理引擎117和控制模块118可以在硬件,软件或这两者中实现。在一些实施方式中,运动分析模块116,推理引擎117和控制模块118可以被实现为单个的端到端的AI或ML算法。

计算设备115可以是运动设备,电子平板计算机,膝上型计算机或台式计算机等。计算设备115可以具有通用处理器,图形处理单元(GPU),专用集成电路(ASIC)或现场可编程门阵列(FPGA)。计算设备115中使用的处理器的特定类型可以至少部分取决于需要多快地将控制信号发送到对象。例如,计算设备115可能需要比机器人系统更快地生成用于内燃机的控制信号。

计算设备115可以在物理上接近相机110和对象105。在这种情况下,计算设备115可以被认为是边缘计算设备。通常,边缘计算设备可以是与数据源或目的地物理上接近的计算设备。在其他实施方式中,计算设备115可以关于对象105和相机110位于远处。在这样的实施方式中,计算设备115可以通过有线或无线网络(例如,光纤网络,

在一些实施方式中,系统100可以具有一个或多个非相机传感器120A-120N。除了视频数据之外,推理引擎117和控制模块118还可以使用来自非相机传感器120A-120N的数据来确定对象的当前状态,预测对象的未来状态,确定预测状态是否是次优的,并生成控制信号以关于对象的预测状态改变对象的状态。推理引擎117和控制模块118可以使用一个或多个传感器融合技术来组合视频数据和来自非相机传感器120A-120N的数据。传感器融合可能涉及随着时间的推移同步来自各个传感器的数据。替代地或附加地,来自非相机传感器的数据可以用于验证使用视频数据做出的预测。

图2是用于监视和控制物理动态系统的示例过程200的流程图。在一个或多个位置的一个或多个适当编程的计算机的系统可以执行过程200。例如,计算设备115可以执行过程200。

物理动态系统可以是动态系统的物理实施方式。动态系统可能是状态空间上时间演化的规则。物理动态系统的一个示例是风力涡轮机。风力涡轮机的输入可以是当前和先前的风速,并且风力涡轮机的输出可以是风力涡轮机发电的电量。风力涡轮机的状态可以由诸如其速度和旋转加速度,其叶片上的力,其偏航角或攻角,其振动频率,甚至来自其他上游风力涡轮机的事件的参数来定义。

物理动态系统的其他示例是核反应堆,化学反应堆,内燃机,半导体制造系统,机翼,等离子体系统,生物系统,医学成像系统以及用于金融交易系统的数据源。

在某些情况下,物理动态系统可以是物理动态系统的模拟。物理动态系统的模拟可以是代表物理动态系统的结构和功能的计算机模型(例如,三维计算机模型)。可以使用通用对抗网络(GAN)进行物理动态系统的模拟。GAN可以包括生成网络和判别网络。生成网络可以生成候选模拟,而判别网络可以估计候选模拟。判别网络的目标可以是在模拟和真实数据分布之间进行区分,而生成网络的目标可以是增加判别网络的错误率。反向传播可以应用于两个网络,以便生成网络产生更好的模拟,而判别网络更熟练地标记模拟。

在过程200的第一操作中,一个或多个适当编程的计算机的系统可以获得物理动态系统的视频数据(205)。

在第二操作中,系统可以对视频数据执行运动分析以生成修改后的视频数据(210)。对视频数据执行运动分析以生成修改后的视频数据可能涉及识别,放大或以其他方式修改系统在视频数据中检测到的运动。例如,系统可以生成修改后的视频数据,其中物理动态系统的振动被放大或以其他方式被扩大。放大这样的振动可以使振动对人类和处理修改后的视频数据的后续算法都更易察觉。

系统可以使用任何适当的计算机视觉,ML或AI算法以对视频数据执行运动分析,以生成修改后的视频数据。这样的算法可以通过跟踪像素中的强度变化和/或过滤视频数据中的一个或多个(空间或时间)频率来对视频数据执行运动分析。更具体地,算法可以首先识别并在语义上标记视频数据中的像素组,以识别视频数据中的关注区域。例如,系统可以识别物理动态系统的特定组件,并为该组件分配名称。该过程可以被称为“语义分割”。接下来,算法可以将视频数据分解为不同的空间比例和方位。此后,算法可以在时间上过滤关注区域以识别关注区域中的移动或振动。在某些情况下,不同的算法可以并行地对每个空间比例和方位进行操作。每种算法都可以检查不同特征的视频数据。以下段落将描述运动分析算法的特定示例,包括空间分析算法(例如,语义分割算法)和时间分析算法。尽管分别描述了这两种类型的算法,但是可以将它们组合以形成单个的端到端的时空分析算法。例如,可以将时间过滤器应用于空间分析算法以形成这种端对端算法。

空间分析算法的一个示例是对象检测和跟踪算法。对象检测和跟踪算法可以通过识别视频中像素强度或颜色快速变化的位置,来检测,识别和跟踪视频中的对象边缘。这样的变化可以指示对象边缘。通过比较视频帧之间的像素,可以随时间跟踪对象边缘。在某些情况下,系统可以替代地使用神经网络来检测,识别和/或跟踪对象。神经网络可以采用多层操作来预测来自一个或多个输入的一个或多个输出。神经网络可包括位于输入层和输出层之间的一个或多个隐藏层。每一层的输出可以用作另一层(例如,下一个隐藏层或输出层)的输入。

神经网络的每一层可以指定要在该层的输入上执行的一个或多个转换操作。这样的转换操作可以被称为神经元。特定神经元的输出可以是神经元的输入的加权总和,其被偏置调整并乘以激活函数,例如,整流线性单元(ReLU)或S形函数。

训练神经网络可以涉及向神经网络提供标记的输入(即具有已知输出的输入)以生成预测输出,将预测输出与已知输出进行比较,以及更新算法的权重和偏差以总计在预测输出和已知输出之间的差。具体地,可以使用成本函数来计算预测输出与已知输出之间的差。通过计算成本函数关于网络的权重和偏差的导数,可以在多个周期内迭代地调整权重和偏差以最小化成本函数。当预测的输出满足收敛条件(例如获得较小量的计算成本)时,训练可能会完成。

卷积神经网络(CNN)可能特别擅长对视频中的对象进行分类。CNN可能是神经网络,其中某些层(称为卷积层)中的神经元仅从视频的一小部分接收像素。这种卷积层中的每个神经元可以具有相同的权重。以此方式,卷积层可以学习权重,其允许卷积层检测图像的任何部分中的特定特征,例如形状或边缘。

时间分析算法的一个示例是光流算法。光流算法可以通过例如使用泰勒级数逼近计算关于对象的空间和时间坐标的偏导数来估计视频中对象的运动。拉格朗日运动放大算法可以使用这样的光流算法来估计由一组像素定义的对象的速度,然后放大所估计的速度以生成放大的视频。

替代地或附加地,该系统可以使用欧拉视频放大来执行运动分析。欧拉视频放大算法可以估计和放大视频帧中固定图像位置处的细微变化,例如像素强度的变化,而不是跨多个帧在不同位置中的匹配像素。欧拉视频放大技术可以包括通过带通过滤在空间上分解视频帧,即识别对象边缘或感兴趣的区域,以及在时间上过滤分解后的视频帧以识别要放大的区域。

替代地或附加地,系统可以使用视频加速度放大算法来执行运动分析。视频加速度放大算法可以放大对象在视频中的加速度,而不是线性运动。在某些情况下,该算法可以在相位域中放大视频。在Yichao Zhang等人的Video Acceleration Magnification(2017年4月22日,网址https://arxiv.org/pdf/1704.04186.pdf)中更详细地描述视频加速度放大,其通过引用全部并入在此。

替代地或附加地,系统可以对视频执行基于相位的运动估计。基于相位的运动估计算法可以在多个空间比例和方位处计算视频随时间的相位。然后,该算法可以在时间上对这些相位进行带通,以隔离与给定应用相关的特定时间频率,并删除任何时间DC分量。这些时间上带通的相位可以对应于不同空间尺度和方向中的运动。为了合成放大的运动,可以将带通相位乘以放大系数α。然后,可以通过针对每个帧以该量修改每个系数的相位,使用放大的相位差来放大或减弱序列中的运动。

在对视频数据执行运动分析以生成修改后的视频数据之后,系统可以处理修改后的视频数据以生成控制信号以控制物理动态系统(215)。处理修改后的视频数据以生成控制信号以控制物理动态系统可以包括确定物理动态系统的当前状态以及预测物理动态系统的未来状态。此后,系统可以确定预测状态是最佳还是次优,并生成配置为关于预测状态改变或维持物理动态系统状态的控制信号。

例如,如果系统预测物理动态系统的未来状态是次优的,则控制信号可以被配置为使物理动态系统执行校正动作。替代地或附加地,例如,如果系统预测物理动态系统即将发生灾难性故障,则控制信号可以被配置为使物理动态系统关闭。替代地或附加地,例如,如果系统预测物理动态系统的未来状态是正常的,则控制信号可以被配置为使物理动态系统按原样继续操作。在某些情况下,控制信号可以是空信号。

图3是用于处理经修改后的视频数据以生成控制信号以控制物理动态系统的示例过程300的流程图。在一个或多个位置的一个或多个适当编程的计算机的系统可以执行过程300。例如,计算设备115可以执行过程300。

在第一操作中,系统可以使用AI处理修改后的视频数据,以识别物理动态系统的一个或多个特征(305)。一个或多个特征可以是物理动态系统的当前状态。当前状态可以是定义当前状态的参数或变量的向量。参数或变量可以包括例如物理动态系统的温度或颜色,物理动态系统的速度或加速度,物理动态系统的应力或应变分布,或物理动态系统的振动频率。

在第二操作中,系统可以使用AI至少部分地基于修改后的视频数据或其派生来预测物理动态系统的未来状态,例如物理动态系统的当前状态(310)。AI可以与用于识别物理动态系统的一个或多个特征的AI相同或不同。也就是说,两者可以一起训练或分开训练。

物理动态系统的预测状态可以是二进制分类。例如,系统可以将预测状态分类为正常或异常。替代地,系统可以预测定义预测状态的一个或多个参数或变量。系统可以为那些参数或变量输出离散值,或者可以为那些参数或变量输出概率分布。

物理动态系统的预测状态可能是异常。异常可能是缺陷。该缺陷可能是结构缺陷(例如,断裂)。该缺陷可能是无法产生所需产物,例如无法在反应器中产生所需化学品的故障。

预测物理动态系统的未来状态可以包括识别指示在修改后的视频数据中的物理动态系统的预测状态的一组特征。在某些情况下,该组特征可以包括空间和/或时间特征。例如,一组特征可以包括物理动态系统的振动频率,物理动态系统的移动,物理动态系统的加速度,物理动态系统的颜色变化(指示温度变化)等。在某些情况下,肉眼可能不易察觉这些变化。

在某些情况下,系统可以将关于物理动态系统的当前或预测状态的警报或状态指示符实时发送到监视平台。监视平台可以被配置为使人类操作员能够监视和/或操作物理动态系统。例如,监视平台可以被配置为在物理动态系统即将发生故障的情况下使人类操作员能够干预。

在预测物理动态系统的未来状态之后,系统可以确定预测状态是最优的还是次优的(315)。例如,如果物理动态系统未以其最大效率的至少约70%、75%、80%、85%、90%或95%或更高操作,则预测状态可能是次佳的。替代地,如果预期物理动态系统经历故障,则预测状态可能是次佳的。

系统然后可以使用AI来确定,生成控制信号并将其发送到物理动态系统,其被配置为关于预测状态改变或维持物理动态系统的状态(320)。即,控制信号可以被配置为使物理动态系统靠近或远离预测状态运动,或维持其当前状态。AI可以与用于识别物理动态系统的一个或多个特征或预测物理动态系统的未来状态的AI相同或不同。即,可以以端到端的方式一起或单独地训练AI算法。系统可以将控制信号实时发送到物理动态系统。即,系统可以在物理动态系统达到预测状态之前发送控制信号。以这种方式,如果预测状态是次优的,则系统可以防止物理动态系统达到预测状态。

控制信号可以被配置为使物理动态系统执行校正动作,例如,以提高物理动态系统的操作效率。替代地或附加地,例如,如果系统预测即将发生灾难性故障,则控制信号可以被配置为使物理动态系统关闭。替代地或附加地,例如,如果系统预测物理动态系统的未来状态在正常范围内,则控制信号可以被配置为使物理动态系统继续操作。在某些情况下,控制信号可以是空信号。

在一些实现中,除了视频数据之外,本文描述的AI还可以使用非相机数据来确定物理动态系统的当前状态,预测物理动态系统的未来或生成控制信号。AI可以使用一个或多个传感器融合技术来组合视频数据和来自非相机传感器的数据。传感器融合可以包括例如使用来自模数转换器,时间序列数据库和/或物联网API的传感器数据随着时间的推移同步来自各种传感器的数据。替代地或附加地,来自非相机传感器的数据可以用于验证使用视频数据做出的预测。例如,验证的预测可以用作训练数据以自适应地对AI执行再训练。

在某些情况下,系统可以实时地再训练上述任何AI(325)。该系统可以使用监督学习过程来再训练AI。监督学习过程的训练数据可以包括物理动态系统的过去状态、现在状态和预测状态。例如,为了再训练用于预测物理动态系统的未来状态的AI,系统可以将物理动态系统的预测状态与实际观察到的状态进行比较,对应地例如通过使用梯度下降的反向传播相应地调整AI的参数。作为另一个示例,为了再训练用于生成物理动态系统的控制信号的AI,系统可以类似地将控制信号的预期效果与其实际效果进行比较,并相应地调整AI算法的参数。

在某些情况下,系统可以仅再训练AI的一部分,例如神经网络的最后一层。在这种情况下,可能不需要反向传播。为了调整神经网络最后一层的权重和偏差,系统可以使用加权(递归)最小二乘法。也就是说,系统可以尝试通过(递归)最小化与输入信号有关的最小二乘成本函数来估计权重和偏差。可以对(递归)最小二乘法执行加权,因为可以对某些输入信号(例如,最近接收到的输入信号)执行更重的加权。在Adam Vaughan等人的Real-timeadaptive machine learning for non-stationary,near chaotic gasoline enginecombustion time series(神经网络70(2015))中更详细地描述了加权递归最小二乘法,其通过引用整体并入在此。

在某些情况下,系统可以使用无监督或半监督的学习过程来再训练AI,例如,通过基于物理动态系统的操作状态推断训练数据的标签。

训练AI可能包括使用历史离线训练数据和自适应在线训练数据的加权混合。

上面提到的AI可以采取几种不同的形式。在某些情况下,AI可能是深度神经网络。深度神经网络可以对物理动态系统的当前状态进行分类,或者将物理动态系统的未来状态预测为正常或异常,或者最优或次优。替代地,分类可以具有更精细的分辨率。例如,深度神经网络可以沿着尺度对物理动态系统的当前状态进行分类或预测物理动态系统的未来状态,或者可以预测定义预测状态的一个或多个参数或变量。

深度神经网络可以是CNN或递归神经网络(RNN)。CNN可能特别擅长分析视频中的小动作并对其进行分类。CNN可能是神经网络,其中某些层(称为卷积层)中的神经元仅从视频的一小部分接收像素。这种卷积层中的每个神经元可以具有相同的权重。以此方式,卷积层可以学习权重,其允许卷积层检测图像的任何部分中的特定特征,例如形状或边缘。

RNN可以特别擅长分析时序数据。RNN可以包括输入层,该输入层被配置为接收一系列时序输入,例如,视频中的一系列帧。RNN还可以包括维持状态的一个或多个隐藏递归层。在每个时间步骤处,每个隐藏的递归层可以计算该层的输出和下一状态,其中下一状态可以取决于先前状态和当前输入。该状态可以跨时间步骤维护,并且可以捕获输入序列中的依存关系。这样的RNN可以被用来预测物理动态系统的未来状态。RNN的一个示例是长短期存储网络(LSTM)。LSTM单元可以由单体、输入门、输出门和遗忘门组成。单元可以负责跟踪输入序列中元素之间的依存关系。输入门可以控制新值流入单体的程度,遗忘门可以控制值保留在单体中的程度,输出门可以控制在单体中的值用于计算LSTM单元的输出激活的程度。LSTM门的激活功能可以是逻辑功能。

在某些情况下,本文描述的AI可以是强化学习算法。强化学习算法可以通过在未知领域的探索与当前知识的开发之间取得平衡来寻求问题的最佳解决方案。在强化学习中,不需要使用标记的输入输出对。相反,代理可以从可用动作集合中选择动作。该动作可能导致新的环境状态。状态变化可能具有与其相关联的奖励,并且取决于新状态是好于还是差于先前状态,奖励可能是积极的或负面的。代理的目标可能是收集尽可能多的奖励,例如在模拟中最大化视频游戏得分。

代理可以从中选择的可用动作集合可以是动作的概率分布。可以随着代理人获得奖励而调整概率分布。即,导致负面奖励的动作可以被缓慢地从概率分布中滤除,而导致积极奖励的动作可以在概率分布中被强调。在本文所述的异常检测和预测性维护算法的上下文中,状态可以是物理动态系统的状态,并且奖励功能可以奖励维持正常状态的控制信号的产生。强化学习算法(通常称为AI)可以是“端到端”的,因为它确定物理动态系统的当前状态,预测未来的状态,并使用单个集成的过程的一部分生成适当的控制信号。

在某些情况下,本文描述的AI可以是储层计算网络。储层计算网络可以看作是神经网络的扩展。通常,可以将输入信号馈入固定的但随机的动态系统中,该系统称为储层,而储层的动态可以将输入映射到更高的维度。然后,可以训练简单的读出机构以读取储层的状态并将其映射到所需的输出。储层计算网络的一个示例是液体状态机(LSM)。LSM可以包括大量神经元,这些神经元接收随时间变化的输入(例如,物理动态系统的视频数据),形成外部源和其他神经元。神经元可以彼此随机连接。连接的递归性质可能会将随时间变化的输入转变为激活的时空模式。激活的时空模式可以通过线性判别单元读取。递归连接的节点的汤可以在输入上计算各种的非线性函数。

在某些情况下,本文描述的AI可以是转移学习算法。可以训练传递学习算法来解决一个问题,并通过调整原始算法的参数来使其适于解决不同但相关的问题。

可以使用监督学习过程来训练本文描述的AI。具体地,可以通过向AI提供物理动态系统的历史标签视频数据来训练AI。标签可以指示在视频数据的特定帧处的物理动态系统的状态。替代地,可以使用无监督或半监督学习过程来训练本文描述的AI。具体地,可以通过向AI提供物理动态系统的历史未标记视频数据来训练AI。此后,AI可以推断出视频数据的特定帧指示物理动态系统的异常状态,因为这些帧与其他帧相比是异常值。这些推断可以构成视频数据的标签。如以上更详细地描述的,可以替代地使用强化学习过程来训练某些AI。

图4是用于解释AI“看到”什么的示例过程400的流程图。可以由一个或多个位置的一个或多个计算机的系统来执行过程400。

系统可以获得对象的视频(405)。该系统可以使用AI来处理视频以生成识别对象的特征的输出(410)。AI可以是例如本公开中描述的任何AI或ML算法。

对象的特征可以是对象的当前状态,例如描述对象的参数、变量或特征的集合。例如,对象的特征可以是对象的空间或时间特征。空间或时间特征可以是对象的颜色变化,或者可以是对象的振动或移动。在某些情况下,肉眼可能察觉不到振动或移动。该特征可以是对象中的异常。异常可以是缺陷。该缺陷可以是结构缺陷。在某些情况下,对象的特征可以是关于对象的未来状态的预测或分类。

系统可以在用户的电子设备的用户界面上呈现输出、视频和视频的增强派生(415)。在某些情况下,系统可以仅呈现视频的输出和增强派生。

可以在增强视频的一个或多个特征时生成视频的增强派生。增强视频的一个或多个特征可以包括例如放大视频中对象的振动或移动。增强视频的一个或多个特征可以替代地或附加地包括:放大对象的颜色变化;识别或分类对象的结构特征;或从视频中去除噪声。该系统可以使用参考图2描述的运动分析技术中的一个来生成视频的增强派生。

在某些情况下,用户界面可以是虚拟现实界面,并且系统可以在用户在现实生活中看到的内容上叠加视频的增强派生。

在同一用户界面中呈现输出,视频和视频的增强派生以供用户同时查看,可以在执行异常检测,预测和/或控制时为用户提供“AI看到”什么的见解。在某些情况下,原始的未增强视频可能会显示该对象正在按预期操作。但是,视频的增强派生可能绘制不同的图片。例如,飞机机翼视频的增强派生可能示出它实际上在剧烈振动。尽管AI可以使用训练的微调参数检测到这些振动,但这些振动对于肉眼来说可能是无法察觉的。例如,将输出,视频和视频的增强派生一起呈现可以允许用户更容易地看到导致AI检测异常的数据变化。这样,过程400可以是有价值的AI工具,俗称“可解释的AI”或“可解释的AI”。

如果输出指示例如对象中的异常或对象具有次优的未来状态,则用户界面可以可选地使用户能够执行校正动作。如果用户确实执行了校正动作,则可以重复过程400以示出对象状态的改善。这可以进一步改善用户对AI或动态系统本身如何工作的理解。

图5示出了“可解释的AI”用户界面的示例。用户界面的左窗口可以示出飞机机翼的视频。用户界面的右窗口可以示出飞机机翼视频的修改版本。例如,右窗口可以示出视频的一个版本,在该版本中,飞机机翼的振动被放大,使得其可以被用户感知到。右窗口可能还会示出输出。在某些情况下,输出可以是指示振动异常的警告信号。替代地或附加地,输出可以指示在飞机机翼上何处存在结构缺陷。该用户界面可以帮助向用户解释为什么底层的ML或AI算法(例如,预测性维护算法)确定例如出于安全原因应该将飞机停飞或者应该重新设计飞机机翼。在没有清晰显示放大的振动的情况下,从工程角度看,用户可能无法理解为什么飞机应该停飞。放大后的视频可以帮助解释底层ML或AI算法“看到”的问题。这样,用户界面可以帮助用户更快地做出更好的操作决策。

图6是用于提供视频数据库的搜索界面的过程600的流程图。可以由在一个或多个位置的一个或多个适当编程的计算机来执行过程500。

系统可以获得对象的视频数据(605)。该系统可以使用计算机视觉或机器学习算法来处理视频数据,以识别对象的多个特征(610)。多个特征可以是对象的振动频率,对象的颜色变化或对象的分类。

对于对象的多个特征中的每一个,系统可以与特征的语义描述符相关联地存储定义特征的数据和其中出现该特征的视频数据的识别符(615)。例如,如果对象的特定特征是对象的振动频率,则系统可以将频率值以及其中该频率值出现的视频,帧和帧位置的识别符存储在称为“频率”的数据库表中。

系统可以为数据库提供搜索界面(620)。搜索界面可以被配置为使用户能够至少使用特征的语义描述符来查询数据库以访问视频数据。例如,查询可以指定(i)术语“频率”和(ii)频率范围。数据库可以返回视频帧,链接到视频帧或具有这些频率的视频帧的识别符。这样的数据库可以促进快速视频搜索。在某些情况下,查询可以是SQL类型的查询。

本文所述的系统和方法可以用于基于在风电场上游的另一个风力涡轮机中观察到的潜在相关的湍流叶片运动来控制风力涡轮机叶片的攻角致动器。本文所述的系统和方法还可用于跟踪由变化的火焰加热的结构的压力或挠曲,或监测火焰本身。本文所述的系统和方法还可以监视火箭在发射过程中弯曲时火箭中的内部桁架结构的线边缘,而不是使用负载单元,应变仪或加速计来确定任务是否应中止。

计算机系统

本公开提供了被编程为实现本公开的方法的计算机系统。图7示出了被编程或以其他方式配置为控制物理动态系统,执行可解释的AI过程或实现视频搜索界面的计算机系统701。计算机系统701可以是用户的电子设备或关于电子设备位于远程的计算机系统。该电子设备可以是移动电子设备。

计算机系统701包括中央处理单元(CPU,在本文中也称为“处理器”和“计算机处理器”)705,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统701还包括存储器或存储器位置710(例如,随机存取存储器,只读存储器,闪存),电子存储单元715(例如,硬盘),用于与一个或多个其他系统通信的通信接口720(例如,网络适配器)和外围设备725,例如高速缓存,其他存储器,数据存储和/或电子显示适配器。存储器710,存储单元715,接口720和外围设备725通过诸如主板的通信总线(实线)与CPU705通信。存储单元715可以是用于存储数据的数据存储单元(或数据存储库)。可以借助于通信接口720将计算机系统701可操作地耦合到计算机网络(“网络”)730。网络730可以是因特网,内联网和/或外部网,或者内部网和/或与因特网通信外联网。在某些情况下,网络730是电信和/或数据网络。网络730可以包括一个或多个计算机服务器,其可以启用分布式计算,例如云计算。在某些情况下,网络730可以借助于计算机系统701实现对等网络,该对等网络可以使耦合到计算机系统701的设备能够充当客户端或服务器。

CPU 705可以执行可以在程序或软件中实现的一系列机器可读指令。指令可以被存储在诸如存储器710的存储器位置中。指令可以被定向到CPU 705,CPU 705可以随后执行编程或以其他方式配置CPU 705以实现本公开的方法。由CPU 705执行的操作的示例可以包括获取,解码,执行和写回。

CPU 705可以是诸如集成电路的电路的一部分。系统701的一个或多个其他组件可以被包括在电路中。在某些情况下,该电路是专用集成电路(ASIC)。

存储单元715可以存储文件,例如驱动程序,库和保存的程序。存储单元715可以存储用户数据,例如,用户偏好和用户程序。在某些情况下,计算机系统701可以包括位于计算机系统701外部的一个或多个其他数据存储单元,例如位于通过内部网或因特网与计算机系统701通信的远程服务器上。

计算机系统701可以通过网络730与一个或多个远程计算机系统通信。例如,计算机系统701可以与用户的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例如,便携式PC),平板计算机或平板计算机(例如,

本文所述的方法可以通过存储在计算机系统701的电子存储位置上(例如,存储在存储器710或电子存储单元715上)的机器(例如,计算机处理器)可执行代码的方式来实现。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器705执行。在某些情况下,可以从存储单元715中检索代码并将其存储在存储器710中,以供处理器705随时访问。在某些情况下,可以排除电子存储单元715,并且将机器可执行指令存储在存储器710中。

该代码可以被预编译并配置为与具有适于执行该代码的处理器的机器一起使用,或者可以在运行时被编译。可以以可以选择以使代码能够以预编译或编译的方式执行的编程语言来提供代码。

本文提供的系统和方法的方面,例如计算机系统701,可以在编程中实现。可以将技术的各个方面视为通常以机器可读介质的类型承载或实现的机器(或处理器)可执行代码和/或关联数据的形式的“产品”或“制品”。机器可执行代码可以存储在诸如存储器(例如,只读存储器,随机存取存储器,闪存)或硬盘的电子存储单元上。存储类型的介质可以包括计算机,处理器等的任何或所有有形存储器,或其相关模块,例如各种半导体存储器,磁带驱动器,磁盘驱动器等,它们可以随时提供非暂时性存储以便进行软件编程。软件的全部或部分有时可以通过因特网或其他各种电信网络进行通信。例如,这样的通信可以使得能够将软件从一个计算机或处理器加载到另一计算机或处理器,例如从管理服务器或主机加载到应用服务器的计算机平台。因此,可以承载软件元件的另一种类型的介质包括光波,电波和电磁波,例如,通过有线和光学座机网络以及通过各种空中链路在本地设备之间的物理接口上使用的光波,电波和电磁波。携带诸如有线或无线链路,光链路等的这种波的物理元件也可以被视为承载软件的介质。如本文所使用的,除非限于非暂时性的有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。

因此,诸如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质,载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这种计算机平台的主存储器。有形的传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内的总线的电线。载波传输介质可以采用电或电磁信号或声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间生成的那些。因此,计算机可读介质的常见形式包括:软盘、柔性盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、打孔卡纸磁带、带有孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒带、传输数据或指令的载波、传输此类载波的电缆或链接或计算机可以从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多可能涉及将一个或多个指令的一个或多个序列传送给处理器以供执行。

计算机系统701可包括电子显示器735或与电子显示器735通信,该电子显示器735包括用于提供例如可解释或可解析的AI界面或视频搜索界面的用户界面(UI)740。UI的示例包括但不限于图形用户界面(GUI)和基于web的用户界面。

本公开的方法和系统可以通过一种或多种算法来实现。可以在中央处理单元705执行时通过软件来实现算法。该算法可以是例如用于对物理动态系统执行建模或控制的运动分析,计算机视觉,ML或AI算法。

尽管已经在本文中示出和描述了本发明的优选实施方式,但是对于本领域技术人员而言容易理解的是,仅通过示例的方式提供了这样的实施方式。并非意图通过说明书中提供的特定示例来限制本发明。尽管已经参考前述说明书描述了本发明,但是本文中的实施方式的描述和图示并不意味着以限制性的意义来解释。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化,改变和替代。此外,应理解,本发明的所有方面不限于本文所阐述的具体描述,构造或相对比例,其取决于各种条件和变量。应当理解,本文所述的本发明的实施方式的各种替代方案可以用于实施本发明。因此,可以预期的是,本发明也将涵盖任何这样的替代,修改,变化或等同形式。旨在由以下权利要求书限定本发明的范围,并且由此涵盖这些权利要求书范围内的方法和结构及其等同物。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号