首页> 中国专利> 服务处理方法、装置以及在线服务系统

服务处理方法、装置以及在线服务系统

摘要

本发明实施例涉及一种服务处理方法、装置以及在线服务系统,包括:在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;利用所述第一模型处理所述应用请求,以提供所述在线服务。由此,可以实现在一个在线服务中加载多个模型,实现了在线服务不下线的情况下也能够动态更新模型,以避免现有技术中更新模型时需要进行新旧服务替换从而导致在线服务一段时间内不可用,影响用户体验的问题。

著录项

  • 公开/公告号CN112527318A

    专利类型发明专利

  • 公开/公告日2021-03-19

    原文格式PDF

  • 申请/专利权人 北京奇艺世纪科技有限公司;

    申请/专利号CN202011462427.5

  • 发明设计人 李晨曦;李年华;

    申请日2020-12-10

  • 分类号G06F8/60(20180101);G06F8/65(20180101);G06F9/50(20060101);

  • 代理机构11662 北京华夏泰和知识产权代理有限公司;

  • 代理人卢万腾;李曼

  • 地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦10、11层

  • 入库时间 2023-06-19 10:19:37

说明书

技术领域

本发明实施例涉及互联网技术领域,尤其涉及一种服务处理方法、装置以及在线服务系统。

背景技术

目前,部署在线服务时,首先选定一个用于提供在线服务的模型,比如预测模型,之后,针对该模型部署一个在线服务。在模型更新,比如版本升级后,则针对更新后的模型再部署一个在线服务。在该新的在线服务(以下简称新服务)部署完成后,下线之前的在线服务(以下简称旧服务)并上线新服务。

由此可见,现有的在线服务是基于一个模型部署的,当模型更新时,则需要重新部署在线服务,过程繁杂,并且涉及到新、旧服务切换,如此将导致在线服务在一段时间内不可用,影响用户体验。

发明内容

鉴于此,为解决上述当模型更新时需要重新部署在线服务,导致过程繁杂且在线服务在一段时间内不可用,影响用户体验的技术问题,本发明实施例提供一种服务处理方法、装置以及在线服务系统。

第一方面,本发明实施例提供一种服务处理方法,包括:

在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;

当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;

利用所述第一模型处理所述应用请求,以提供所述在线服务。

在一可能的实施方式中,所述将所述目标模型加载至所述在线服务对应的模型池中,包括:

在接收到对目标模型的触发操作时,触发在线服务部署请求,所述在线服务部署请求用于指示新增在线服务;

创建部署所述在线服务所需的虚拟环境,将所述在线服务部署至所述虚拟环境中;

在所述虚拟环境进行初始化的过程中将初始的模型池加载至所述在线服务,初始的所述模型池为空;

将所述目标模型加载至初始的所述模型池中。

在一可能的实施方式中,所述将所述目标模型加载至所述在线服务对应的模型池中,包括:

在接收到对目标模型的触发操作时,触发在线服务更新请求,所述在线服务更新请求用于指示在所述在线服务中新增模型;

将所述目标模型加载至所述在线服务对应的模型池中。

在一可能的实施方式中,在所述将所述目标模型加载至所述在线服务对应的模型池中之前,所述方法还包括:

获取所述在线服务对应的虚拟环境的空闲资源信息;

在所述空闲资源信息满足预设条件时,执行将所述目标模型加载至所述在线服务对应的模型池中的步骤;

在所述空闲资源信息不满足预设条件时,停止执行将所述目标模型加载至所述在线服务对应的模型池中的步骤,以及触发告警提示,所述告警提示用于指示所述空闲资源信息小于所述目标模型的预计资源配额。

在一可能的实施方式中,所述方法还包括:

在接收到模型删除指令时,根据所述模型删除指令从所述模型池中确定待删除模型;

将所述待删除模型从所述模型池中删除。

在一可能的实施方式中,在所述将所述目标模型加载至所述在线服务对应的模型池中之后,还包括:

在所述在线服务的全局标识信息中添加所述目标模型的模型标识码和模型对象实例;

所述从所述模型池中确定与所述应用请求相匹配的第一模型,包括:

从所述应用请求中解析出目标模型标识码;

根据所述目标模型标识码查找所述在线服务的全局标识信息,得到与所述目标模型标识码对应的目标模型对象实例;

将所述模型池中,与所述目标模型对象实例对应的模型确定为与所述应用请求相匹配的第一模型。

在一可能的实施方式中,还包括:

将所述第一模型的累计被访问次数加1,所述累计被访问次数的初始值为0;

确定所述第一模型处理所述应用请求的处理用时;

在设定周期到达时,获取所述在线服务当前已加载的每一模型的累计被访问次数和平均处理用时;

将所述每一模型的累计被访问次数和平均处理用时发送至在线服务管理平台。

在一可能的实施方式中,还包括:

在设定周期到达时,获取所述在线服务的至少一项运行参数;

将所述至少一项运行参数发送至在线服务管理平台。

第二方面,本发明实施例提供一种在线服务系统,包括:

接口模块,接收对目标模型的在线服务部署请求;

模型管理模块,根据所述在线服务部署请求将目标模型加载至在线服务对应的模型池中;

所述模型池,将已加载的所述目标模型封装在模型实例中,启动所述目标模型的服务进程。

在一可能的实施方式中,所述接口模块,还用于接收对目标模型的在线服务更新请求;

所述模型管理模块,还用于根据所述在线服务更新请求将目标模型加载至在线服务对应的模型池中。

在一可能的实施方式中,所述接口模块,还用于接收对在线服务的应用请求;

所述系统还包括:

服务路由模块,从所述模型池中确定与所述应用请求相匹配的第一模型,调用所述模型池中的第一模型处理所述应用请求;

所述接口模块,将所述应用请求对应的处理结果发送至外部设备。

第三方面,本发明实施例提供一种在线服务架构,包括:

服务管理系统,接收对目标模型的触发操作,触发在线服务部署请求或者触发在线服务更新请求;根据所述在线服务部署请求触发资源管理系统创建部署所述在线服务所需的虚拟环境,将所述目标模型发送至所述虚拟环境;根据所述在线服务更新请求将所述目标模型发送至所述在线服务对应的虚拟环境;

资源管理系统,创建部署在线服务所需的虚拟环境,将所述在线服务部署至所述虚拟环境中,以及在所述虚拟环境进行初始化的过程中将初始的模型池加载至所述在线服务,初始的所述模型池为空;

在线服务系统,包括接口模块,接收对目标模型的在线服务部署请求;模型管理模块,根据所述在线服务部署请求将目标模型加载至在线服务对应的模型池中;所述模型池,将已加载的所述目标模型封装在模型实例中,启动所述目标模型的服务进程。

第四方面,本发明实施例提供一种服务处理装置,包括:

模型加载模块,用于在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;

模型确定模块,用于当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;

处理模块,用于利用所述第一模型处理所述应用请求,以提供所述在线服务。

在一可能的实施方式中,所述模型加载模块具体用于:

在接收到对目标模型的触发操作时,触发在线服务部署请求,所述在线服务部署请求用于指示新增在线服务;

创建部署所述在线服务所需的虚拟环境,将所述在线服务部署至所述虚拟环境中;

在所述虚拟环境进行初始化的过程中将初始的模型池加载至所述在线服务,初始的所述模型池为空;

将所述目标模型加载至初始的所述模型池中。

在一可能的实施方式中,所述模型加载模块具体用于:

在接收到对目标模型的触发操作时,触发在线服务更新请求,所述在线服务更新请求用于指示在所述在线服务中新增模型;

将所述目标模型加载至所述在线服务对应的模型池中。

在一可能的实施方式中,所述装置还包括:

资源获取模块,用于获取所述在线服务对应的虚拟环境的空闲资源信息;

所述模块加载模块,用于在所述空闲资源信息满足预设条件时,执行将所述目标模型加载至所述在线服务对应的模型池中的步骤;

告警模块,用于在所述空闲资源信息不满足预设条件时,停止执行将所述目标模型加载至所述在线服务对应的模型池中的步骤,以及触发告警提示,所述告警提示用于指示所述空闲资源信息小于所述目标模型的预计资源配额。

在一可能的实施方式中,所述装置还包括:

模型删除模块,用于在接收到模型删除指令时,根据所述模型删除指令从所述模型池中确定待删除模型;将所述待删除模型从所述模型池中删除。

在一可能的实施方式中,所述装置还包括:

信息添加模块,用于在所述在线服务的全局标识信息中添加所述目标模型的模型标识码和模型对象实例;

所述模型确定模块具体用于:

从所述应用请求中解析出目标模型标识码;

根据所述目标模型标识码查找所述在线服务的全局标识信息,得到与所述目标模型标识码对应的目标模型对象实例;

将所述模型池中,与所述目标模型对象实例对应的模型确定为与所述应用请求相匹配的第一模型。

在一可能的实施方式中,所述装置还包括:

第一统计模块,用于将所述第一模型的累计被访问次数加1,所述累计被访问次数的初始值为0;

第二统计模块,用于确定所述第一模型处理所述应用请求的处理用时;

数据获取模块,用于在设定周期到达时,获取所述在线服务当前已加载的每一模型的累计被访问次数和平均处理用时;

第一发送模块,用于将所述每一模型的累计被访问次数和平均处理用时发送至在线服务管理平台。

在一可能的实施方式中,所述装置还包括:

参数获取模块,用于在设定周期到达时,获取所述在线服务的至少一项运行参数;

第二发送模块,用于将所述至少一项运行参数发送至在线服务管理平台。

第五方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的服务处理程序,以实现第一方面中任一项所述的服务处理方法。

第六方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的服务处理方法。

本发明实施例提供的技术方案,通过在进行在线服务部署时,将用户选中的目标模型加载至在线服务对应的模型池中,实现了针对在线服务部署模型,而且一个在线服务中可加载多个模型,这相较于现有技术中针对一个模型部署一个在线服务而言,不仅提高了虚拟资源的利用率,还实现了在线服务不下线的情况下也能够动态更新模型,如此则能够避免现有技术中更新模型时需要进行新旧服务替换从而导致在线服务一段时间内不可用,影响用户体验的问题。

以及,通过当接收到针对在线服务的应用请求时,从模型池中确定与应用请求相匹配的第一模型,利用第一模型处理应用请求以提供在线服务实现了在一个在线服务中加载有多个模型的情况下,能够由用户根据实际需要灵活指定要访问的模型,从而实现了可控式的模型访问。

附图说明

图1为本发明实施例示出的一种在线服务架构的示意图;

图2为服务管理系统101提供的一种用户交互界面的示意图;

图3为服务管理系统101提供的另一种用户交互界面的示意图;

图4为服务管理系统101提供的再一种用户交互界面的示意图;

图5为本发明实施例示出的一种在线服务系统103的架构示意图;

图6为本发明实施例提供的一种服务处理方法的实施例流程图;

图7为本发明实施例提供的另一种服务处理方法的实施例流程图;

图8为本发明实施例提供的一种服务处理装置的实施例框图;

图9为本发明实施例提供的一种的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为便于理解本发明实施例,下面首先结合附图对本发明涉及的在线服务架构进行举例说明:

参见图1,为本发明实施例示出的一种在线服务架构的示意图。

图1所示例的在线服务架构100中包括服务管理系统101、资源管理系统102,以及在线服务系统103。其中,服务管理系统101与资源管理系统102之间具有通信链路,可包括无线链路、有线链路(比如光纤电缆等)。在线服务系统103则部署于资源管理系统102所提供的虚拟环境,比如容器中。

服务管理系统101可提供用户交互平台,使得用户通过服务管理系统101部署或管理在线服务与模型,其中,模型是指以PMML文件为主的模型描述文件,PMML文件包含模型的类型、参数等信息,通过PMML文件可实现模型的跨平台读写。

资源管理系统102可包括容器管理系统1021和域名及网络服务解析系统1022。其中,容器管理系统1021用于实现容器的创建和在线服务的部署;域名及网络服务解析系统1022用于实现容器域名或服务通道的申请,以供用户通过域名或服务通道访问容器中部署的在线服务。

具体的,服务管理系统101,接收对目标模型的触发操作,触发在线服务部署请求或者触发在线服务更新请求;在触发在线服务部署请求的情况下,则根据在线服务部署请求触发资源管理系统102创建部署在线服务所需的虚拟环境,将目标模型发送至该虚拟环境;在触发在线服务更新请求的情况下,则根据在线服务更新请求将目标模型发送至在线服务对应的虚拟环境。

资源管理系统102,在服务管理系统101触发在线服务部署请求的情况下,容器管理系统1021创建部署在线服务所需的虚拟环境,将在线服务部署至虚拟环境中,以及在虚拟环境进行初始化的过程中加载在线服务系统103的各个模块,其中包括初始的模型池,该初始的模型池为空,下一步则将目标模型加载至初始的模型池中,启动目标模型的服务进程。至此则完成了在线服务的部署。

可以理解的是,在实践中,上述服务管理系统101、容器管理系统1021,以及域名及网络服务解析系统1022分别可包括一台或多台电子设备,图1中仅以一台电子设备为例。上述电子设备可以是支持具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、服务器等。

以下结合实际应用对上述服务管理系统101和资源管理系统102进行进一步的解释说明:

在应用中,作为一个实施例,如图2所示,为服务管理系统101提供的一种用户交互界面的示意图。基于图2所示例的用户交互界面,在部署在线服务时,用户可选中一个模型,比如图2中用户选中“随机森林二分类”,然后选择“部署在线服务”图标,当检测到“部署在线服务”图标被触发时,服务管理系统101可展示如图3所示例的用户交互界面。

基于图3所示例的用户交互界面,用户可选择“新增在线服务”图标,并填写在线服务的相关信息,包括但不限于:服务别名、支持的协议、资源配置信息(比如容器个数、每个容器的CPU数量、内存数量、在线服务对应的模型池所能容纳的最大模型数等)。之后,用户选择“新增”图标,当检测到“新增”图标被触发时,则触发上述在线服务部署请求。

资源管理系统102在服务管理系统101触发在线服务部署请求的情况下,可根据上述用户填写的资源配置信息创建部署在线服务所需的虚拟环境,比如容器,然后将在线服务部署至创建的虚拟环境中,部署完成后,启动虚拟环境,并在虚拟环境进行初始化的过程中记载在线服务系统103的各个模块,其中包括初始的模型池,该初始的模型池为空。至此,则实现了在资源管理系统102提供的虚拟环境中部署在线服务系统103。

在线服务系统103部署完成后,则将上述用户选中的目标模型加载至模型池中,启动目标模型的服务进程。至此,则实现了部署新的在线服务。

作为另一个实施例,在更新在线服务时,比如对提供在线服务的模型进行版本更新时,用户可基于图2所示例的用户交互界面选中更新后的模型,然后选择“部署在线服务”图标,当检测到“部署在线服务”图标被触发时,服务管理系统101展示如图3所示例的用户交互界面。

基于图3所示例的用户交互界面,用户可选择“加入到已有的在线服务”图标,当检测到“加入到已有的在线服务”图标被触发时,则触发上述在线服务更新请求。

资源管理系统102在服务管理系统101触发在线服务更新请求的情况下,不再创建虚拟环境,而是由已部署的在线服务系统103根据在线服务更新请求将上述用户选中的目标模型加载至模型池中,并启动目标模型的服务进程。至此,则实现了动态更新在线服务。

作为再一个实施例,更新在线服务还可包括删除在线服务中已加载的模型。在该应用场景下,如图4所示,为服务管理系统101提供的另一种用户交互界面的示意图,图4所示界面中示意出了服务名称为“11”的在线服务当前已加载的模型。基于图4所示例的用户交互界面,用户可选中其中一个模型,然后选择“删除”图标,当检测到“删除”图标被触发时,服务管理系统101触发模型删除指令。

在服务管理系统101触发模型删除指令的情况下,已部署的在线服务系统103则根据模型删除指令将上述用户选中的待删除的模型从模型池中删除,并关闭该模型的服务进程。

作为又一个实施例,更新在线服务还可包括暂停运行在线服务中已加载的模型。在该应用场景下,基于图4所示例的用户交互界面,用户可选中其中一个模型,然后选择“暂停”图标,当检测到“暂停”图标被触发时,服务管理系统101触发模型暂停运行指令。

在线服务管理系统101触发模型暂停运行指令的情况下,已部署的在线服务系统103则根据模型暂停运行指令关闭该模型的服务进程。

相应的,作为又一个实施例,基于图4所示例的用户交互界面,用户可选中处于暂停运行状态的其中一个模型,然后选择“启动”图标,当检测到“启动”图标被触发时,服务管理系统101触发模型启动运行指令。

在服务管理系统101触发模型启动运行指令的情况下,已部署的在线服务系统103则根据模型启动运行指令启动该模型的服务进程。

以下对在线服务系统103进行进一步的解释说明:

参见图5,为本发明实施例示出的一种在线服务系统103的架构示意图。

图5所示例的在线服务系统103包括:接口模块1031、模型管理模块1032、模型池1033、服务路由模块1034。其中,接口模块1031与模型管理模块1032、服务路由模块1034通信连接;模型管理模块1032和服务路由模块1034分别与模型池1033通信连接。

具体的,接口模块1031是一个对外接口,可用于接收外部消息,比如接收服务管理系统101触发的对目标模型的在线服务部署请求、或者对目标模型的在线服务更新请求、或者对目标模型的模型删除指令,再或者用户设备对在线服务的应用请求等。在应用中,接口模块1031接收到上述任一请求后,对接收到的请求进行格式转换,以将不同协议(比如HTTP协议、RPC协议等)的请求转换为统一的格式。

此外,作为一个实施例,接口模块1031在接收到外部消息后,可首先对接收到的外部消息的合法性进行认证,在认证通过后,再对接收到的外部消息进行格式转换。以接收到服务管理系统101发送的请求为例,可事先在服务管理系统101和在线服务系统103中设置相同的密钥,服务管理系统101在向在线服务系统103发送请求时,将请求参数与密钥进行连接,得到一个字符串,然后利用设定算法对该字符串进行运算,将运算结果和请求参数一并发送至在线服务系统103。上述设定算法可以为哈希算法,相应的,上述运算结果则为一个哈希值。

在线服务系统103接收到请求后,从中分离出哈希值和请求参数,将分离出的请求参数与本地存储的密钥进行连接,得到一个字符串,然后利用哈希算法对该字符串进行运算,得到一个哈希值,将该哈希值与上述分离出的哈希值进行比较,若两者一致,则意味着接收到的请求合法,反之,若两者不一致,则意味着接收到的请求不合法,此时可丢弃接收到的请求。如此处理可提高系统安全性。

接口模块1031还用于将应用请求对应的处理结果发送至外部设备,比如用户设备。在应用中,接口模块1031可将处理结果转换为应用请求所对应的协议格式,将转换后的处理结果发送至用户设备。

模型管理模块1032,用于根据在线服务部署请求或者在线服务更新请求将目标模型加载至在线服务对应的模型池1033中,还用于根据模型删除指令将待删除的模型从在线服务对应的模型池1033中删除。

具体的,上述在线服务部署请求和在线服务更新请求中可携带目标模型的下载地址,如此,模型管理模块可从在线服务部署请求或在线服务更新请求中解析出下载地址,根据该下载地址从服务管理系统101处下载目标模型。

作为一个实施例,模型管理模块1032还可用于定期获取模型池1033中每一模型的运行状态、累计被访问次数、平均处理用时、在线服务的至少一项运行参数(包括但不限于CPU使用率、内存使用率、带宽占用率等)等,并将获取到的数据通过接口模块1031反馈给在线服务管理系统101。在线服务管理系统101可在本地数据库中存储接收到的上述数据,当接收到用户的查看请求时,可通过可视化界面展示上述数据。如此能够使得用户了解在线服务的服务状态,以及每一模型的性能,便于用户管理维护在线服务。

进一步的,模型管理模块1032在获取到模型的运行状态异常时,还可通过接口模块1031向在线服务管理系统101反馈用于指示模型运行状态异常的心跳报警。如此能够使得用户及时获知运行状态异常的模型,便于用户及时对在线服务进行修复,避免影响用户体验。

模型池1033,定义为一个抽象模型类和接口,用于维护管理在线服务已加载的模型,其在初始状态下为空。当将目标模型加载至模型池1033中时,模型池1033将已加载的目标模型封装在模型实例中,启动目标模型的服务进程。由此可见,每当一个新模型加载后,该新模型便封装在模型实例中,且模型池对外提供统一的接口实现模型的调用,并且,为了提高在线服务的并行化,每个模型维护自己的线程池,如此可调用线程池中不同的线程对多个应用请求进行处理。

服务路由模块1034,可通过一个独立的进程或线程实现,用于从模型池1033中确定与接口模块1031接收到的应用请求相匹配的模型(为描述方便,以下称为第一模型),调用模型池1033中的第一模型处理该应用请求。还用于将第一模型对应用请求的处理结果返回为接口模块1031,以由接口模块1031将处理结果返回给用户设备。

此外,作为一个实施例,服务路由模块1034还在调用第一模型处理应用请求之后,将第一模型的累计被访问次数加1,并记录下本次调用第一模型处理应用请求的处理用时,以便实现上述所描述的模型管理模块1032定期获取模型池1033中每一模型的累计被访问次数和平均处理用时。

此外,作为一个实施例,在线服务系统103还可维护一份全局标识信息,该全局标识信息中可记录有在线服务已加载模型的模型标识码和模型对象实例,作为一个可选的实现方式,该全局标识信息可以哈希表的形式实现,其中,key为模型标识码,value为模型对象实例。

基于此,在将模型加载至模型池1033中之后,还可在上述全局标识信息中添加该模型的模型标识码和模型对象实例;在将模型从模型池1033中删除之后,还可在上述全局标识信息中,删除该模型的模型标识码和模型对象实例。

在应用在线服务时,服务路由模块1034则可从应用请求中解析出模型标识码(为描述方便,以下称目标模型标识码),根据目标模型标识码查找上述全局标识信息,得到与目标模型标识码对应的模型对象实例(为描述方便,以下称目标模型对象实例),将该目标模型对象实例确定为上述第一模型。由此可见,服务路由模块1034根据上述全局标识信息则可快速访问对应的模型。

至此,完成图1所示在线服务架构的描述。

下面结合附图以具体实施例对本发明提供的服务处理方法做进一步的解释说明,实施例并不构成对本发明实施例的限定。

参见图6,为本发明实施例提供的一种服务处理方法的实施例流程图。作为一个实施例,该流程可应用于图1所示例的在线服务架构100,如图6所示,该流程可包括以下步骤:

步骤601、在进行在线服务部署时,接收对目标模型的触发操作,将目标模型加载至在线服务对应的模型池中。

由上述图1所示架构中的相关描述可知,在实际应用中,用户可根据需求选择针对目标模型新增在线服务,或者将目标模型加入到已有的在线服务中。当用户选择针对目标模型新增在线服务时,可触发在线服务部署请求,该在线服务部署请求用于指示新增在线服务;当用户选择将目标模型加入到已有的在线服务中时,可触发在线服务更新请求,该在线服务更新请求用于指示在在线服务中新增模型。

进一步的,由上述图1所示架构中的相关描述可知,当触发在线服务部署请求时,则创建部署在线服务所需的虚拟环境,将在线服务部署至该虚拟环境中,在虚拟环境进行初始化的过程中将初始的模型池加载至在线服务,将目标模型加载至初始的模型池中。当触发在线服务更新请求时,则可直接将目标模型加载至在线服务对应的模型池中。

此外,由上述描述可知,在线服务架构中创建的虚拟环境并非是无限大的,而是具有资源上限的,基于此,作为一个实施例,当触发在线服务更新请求时,可首先获取在线服务对应的虚拟环境的空闲资源信息,判断该空闲资源信息是否满足预设条件,在空闲资源信息满足预设条件时,则意味着虚拟环境足够容纳新的目标模型,因此可执行将目标模型加载至在线服务对应的模型池中的步骤;在空闲资源信息不满足预设条件时,则意味着虚拟环境不足以容纳新的目标模型,此时则可停止执行将目标模型加载至在线服务对应的模型池中的步骤。作为一个可选的实现方式,上述预设条件可包括虚拟环境的空闲资源信息大于或等于目标模型的预计资源配额。

进一步的,在空闲资源不满足预设条件时,还可以触发告警提示,以用于指示空闲资源信息小于目标模型的预计资源配额。

步骤602、当接收到针对在线服务的应用请求时,从模型池中确定与应用请求相匹配的第一模型。

由上述图1所示架构中的相关描述可知,当接收到针对在线服务的应用请求时,可从应用请求中解析出目标模型标识码,根据目标模型标识码查找在线服务的全局标识信息,得到与目标模型标识码对应的目标模型对象实例,将模型池中,与目标模型对象实例对应的模型确定为与应用请求相匹配的第一模型。

步骤603、利用第一模型处理应用请求,以提供在线服务。

本发明实施例提供的技术方案,通过在进行在线服务部署时,将用户选中的目标模型加载至在线服务对应的模型池中,实现了针对在线服务部署模型,而且一个在线服务中可加载多个模型,这相较于现有技术中针对一个模型部署一个在线服务而言,不仅提高了虚拟资源的利用率,还实现了在线服务不下线的情况下也能够动态更新模型,如此则能够避免现有技术中更新模型时需要进行新旧服务替换从而导致在线服务一段时间内不可用,影响用户体验的问题。

以及,通过当接收到针对在线服务的应用请求时,从模型池中确定与应用请求相匹配的第一模型,利用第一模型处理应用请求以提供在线服务实现了在一个在线服务中加载有多个模型的情况下,能够由用户根据实际需要灵活指定要访问的模型,从而实现了可控式的模型访问。

在这一基础上,作为一个示例性应用场景,在对用于提供同一在线服务的两个版本的模型进行AB测试时,则无需部署两个在线服务,不仅节省资源,还具有开发敏捷性,同时也不涉及两个在线服务之间的上下线切换,使得测试过程更加流畅。

参见图7,为本发明实施例提供的另一种服务处理方法的实施例流程图。该图7所示流程在上述图6所示流程的基础上,可包括以下步骤:

步骤701、在进行在线服务部署时,接收对目标模型的触发操作;执行步骤702或步骤706。

步骤702、触发在线服务部署请求。

步骤703、创建部署在线服务所需的虚拟环境,将在线服务部署至虚拟环境中。

步骤704、在虚拟环境进行初始化的过程中将初始的模型池加载至在线服务。

步骤705、将目标模型加载至初始的模型池中,执行步骤708。

步骤706、触发在线服务更新请求。

步骤707、将目标模型加载至在线服务对应的模型池中。

步骤708、在在线服务的全局标识信息中添加目标模型的模型标识码和模型对象实例。

步骤709、当接收到针对在线服务的应用请求时,从模型池中确定与应用请求相匹配的第一模型。

步骤710、利用第一模型处理应用请求,以提供在线服务。

至于上述步骤701~步骤710的详细描述,可参见上述图1和图6中的相关描述,这里不再赘述。

与前述服务处理方法的实施例相对应,本发明还提供服务处理装置的实施例框图。

参见图8,为本发明实施例提供的一种服务处理装置的实施例框图。如图8所示,该装置包括:

模型加载模块81,用于在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;

模型确定模块82,用于当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;

处理模块83,用于利用所述第一模型处理所述应用请求,以提供所述在线服务。

在一可能的实施方式中,所述模型加载模块81具体用于:

在接收到对目标模型的触发操作时,触发在线服务部署请求,所述在线服务部署请求用于指示新增在线服务;

创建部署所述在线服务所需的虚拟环境,将所述在线服务部署至所述虚拟环境中;

在所述虚拟环境进行初始化的过程中将初始的模型池加载至所述在线服务,初始的所述模型池为空;

将所述目标模型加载至初始的所述模型池中。

在一可能的实施方式中,所述模型加载模块81具体用于:

在接收到对目标模型的触发操作时,触发在线服务更新请求,所述在线服务更新请求用于指示在所述在线服务中新增模型;

将所述目标模型加载至所述在线服务对应的模型池中。

在一可能的实施方式中,所述装置还包括(图中未示出):

资源获取模块,用于获取所述在线服务对应的虚拟环境的空闲资源信息;

所述模块加载模块81,用于在所述空闲资源信息满足预设条件时,执行将所述目标模型加载至所述在线服务对应的模型池中的步骤;

告警模块,用于在所述空闲资源信息不满足预设条件时,停止执行将所述目标模型加载至所述在线服务对应的模型池中的步骤,以及触发告警提示,所述告警提示用于指示所述空闲资源信息小于所述目标模型的预计资源配额。

在一可能的实施方式中,所述装置还包括(图中未示出):

模型删除模块,用于在接收到模型删除指令时,根据所述模型删除指令从所述模型池中确定待删除模型;将所述待删除模型从所述模型池中删除。

在一可能的实施方式中,所述装置还包括(图中未示出):

信息添加模块,用于在所述在线服务的全局标识信息中添加所述目标模型的模型标识码和模型对象实例;

所述模型确定模块81具体用于:

从所述应用请求中解析出目标模型标识码;

根据所述目标模型标识码查找所述在线服务的全局标识信息,得到与所述目标模型标识码对应的目标模型对象实例;

将所述模型池中,与所述目标模型对象实例对应的模型确定为与所述应用请求相匹配的第一模型。

在一可能的实施方式中,所述装置还包括(图中未示出):

第一统计模块,用于将所述第一模型的累计被访问次数加1,所述累计被访问次数的初始值为0;

第二统计模块,用于确定所述第一模型处理所述应用请求的处理用时;

数据获取模块,用于在设定周期到达时,获取所述在线服务当前已加载的每一模型的累计被访问次数和平均处理用时;

第一发送模块,用于将所述每一模型的累计被访问次数和平均处理用时发送至在线服务管理平台。

在一可能的实施方式中,所述装置还包括(图中未示出):

参数获取模块,用于在设定周期到达时,获取所述在线服务的至少一项运行参数;

第二发送模块,用于将所述至少一项运行参数发送至在线服务管理平台。

图9为本发明实施例提供的一种的电子设备的结构示意图,图9所示的电子设备900包括:至少一个处理器901、存储器902、至少一个网络接口904和其他用户接口903。电子设备900中的各个组件通过总线系统905耦合在一起。可理解,总线系统905用于实现这些组件之间的连接通信。总线系统905除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图9中将各种总线都标为总线系统905。

其中,用户接口903可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。

可以理解,本发明实施例中的存储器902可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StaticRAM,SRAM)、动态随机存取存储器(DynamicRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM,DRRAM)。本文描述的存储器902旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器902存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统9021和应用程序9022。

其中,操作系统9021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序9022,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序9022中。

在本发明实施例中,通过调用存储器902存储的程序或指令,具体的,可以是应用程序9022中存储的程序或指令,处理器901用于执行各方法实施例所提供的方法步骤,例如包括:

在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;

当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;

利用所述第一模型处理所述应用请求,以提供所述在线服务。

上述本发明实施例揭示的方法可以应用于处理器901中,或者由处理器901实现。处理器901可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器901中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器901可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器902,处理器901读取存储器902中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、数字信号处理器(DigitalSignalProcessing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(ProgrammableLogicDevice,PLD)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本实施例提供的电子设备可以是如图9中所示的电子设备,可执行如图6-7中服务处理方法的所有步骤,进而实现图6-7中服务处理方法的技术效果,具体请参照图6-7相关描述,为简洁描述,在此不作赘述。

本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。

当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的服务处理方法。

所述处理器用于执行存储器中存储的服务处理程序,以实现以下在电子设备侧执行的服务处理方法的步骤:

在进行在线服务部署时,接收对目标模型的触发操作,将所述目标模型加载至所述在线服务对应的模型池中;

当接收到针对所述在线服务的应用请求时,从所述模型池中确定与所述应用请求相匹配的第一模型;

利用所述第一模型处理所述应用请求,以提供所述在线服务。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号