首页> 中国专利> 一种服务器超卖实现方法及装置、存储介质及电子设备

一种服务器超卖实现方法及装置、存储介质及电子设备

摘要

本申请提供了一种服务器超卖实现方法及装置、存储介质及电子设备,获取与问询音频对应的应答音频,并当存在处于空闲状态的图片推理服务器时,控制处于空闲状态的图片推理服务器与客户端建立连接,处于空闲状态的图片推理服务器对目标应答音频进行处理,得到图片序列,在完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接,调用静默视频服务器对图片序列和应答音频进行叠加处理,得到应答视频流并发送至客户端进行数字人应答视频渲染。通过控制图片推理服务器与客户端连接的通断,实现利用处于空闲状态的图片推理服务器对应答音频进行处理,从而实现对图片推理服务器的超卖,为服务器供应方创造更多的经济利益。

著录项

  • 公开/公告号CN113868399A

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 深圳追一科技有限公司;

    申请/专利号CN202111210907.7

  • 发明设计人 常向月;穆少垒;田升;

    申请日2021-10-18

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/583(20190101);G06F16/683(20190101);G06N5/04(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人张倩

  • 地址 518000 广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B

  • 入库时间 2023-06-19 13:29:16

说明书

技术领域

本申请涉及人机交互技术领域,尤其涉及一种服务器超卖实现方法及装置、存储介质及电子设备。

背景技术

近些年来,随着信息通信技术的不断发展和应用,数字人应用场景也日益增多,在应用过程中,用户通过客户端中呈现的数字人画面进行交互,也就是在用户咨询数字人后,通过对应的服务器(包括图片推理服务器和静默视频服务器)处理得到与用户咨询的问题对应的应答视频流,进而在客户端渲染与应答视频流对应的数字人应答视频。

现有技术中,客户端与服务器一一对应,服务器与其对应的客户端建立长期连接关系,也就是说,服务器只能为其对应的客户端提供服务器,而该服务器只有在用户咨询数字人后,才工作,其他时间处于空闲状态,因此,如何提供一种充分利用处于空闲状态的服务器,以为服务器供应方创造更多的经济利益的技术方案,是目前本领域技术亟需解决的技术问题。

发明内容

本申请提供了一种服务器超卖实现方法及装置、存储介质及电子设备,以实现充分利用处于空闲状态的服务器,从而为服务器供应方创造更多的经济利益的目的。

为了实现上述目的,本申请提供了以下技术方案:

一种服务器超卖实现方法,包括:

在接收到客户端发送的问询音频后,获取目标应答音频;所述目标应答音频为与所述问询音频对应的应答音频;

判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器;

若预设的图片推理服务器池中存在处于空闲状态的图片推理服务器,则控制处于空闲状态的图片推理服务器与所述客户端建立连接,以便于处于空闲状态的图片推理服务器对所述目标应答音频进行处理,得到所述目标应答音频对应的图片序列;

在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与所述客户端的连接;

调用预设的静默视频服务器对所述图片序列和所述应答音频进行叠加处理,得到应答视频流;

将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

上述的方法,可选的,还包括:

若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

上述的方法,可选的,所述判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器之前,还包括:

将所述目标应答音频写入预设的任务队列中;

所述控制处于空闲状态的图片推理服务器与所述客户端建立连接,包括:

从所述任务队列中获取所述目标应答音频;

控制处于空闲状态的图片推理服务器与所述客户端建立连接。

上述的方法,可选的,还包括:

若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则返回执行所述判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器的步骤。

上述的方法,可选的,所述将所述目标应答音频写入预设的任务队列中,包括:

判断预设的任务队列中包括的应答音频的数量是否大于预设阈值;

若预设的任务队列中包括的应答音频的数量不大于预设阈值,则将所述目标应答音频写入预设的任务队列中。

上述的方法,可选的,还包括:

若预设的任务队列中包括的应答音频的数量大于预设阈值,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

上述的方法,可选的,所述获取目标应答音频,包括:

识别所述问询音频,得到所述问询音频的文本信息;

从预设的应答文本库中查找与所述问询音频的文本信息相匹配的应答文本;

对所述应答文本进行音频合成处理,得到所述应答文本的应答音频;

将所述应答文本的应答音频确定为目标应答音频。

上述的方法,可选的,所述判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器,包括:

获取预设的图片推理服务器池中包括的每个图片推理服务器的运行指标;

基于每个图片推理服务器的运行指标,确定每个图片推理服务器中处于工作状态的处理器数量;

获取所述图片推理服务器池中包括的每个图片推理服务器的并发能力;

针对每个图片推理服务器,判断所述图片推理服务器中处于工作状态的处理器数量是否小于所述图片推理服务器的并发能力,若小于,则确定所述图片推理服务器处于空闲状态,若不小于,则确定所述图片推理服务器不处于空闲状态。

一种服务器超卖实现装置,包括:

获取单元,用于在接收到客户端发送的问询音频后,获取目标应答音频;所述目标应答音频为与所述问询音频对应的应答音频;

判断单元,用于判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器;

第一控制单元,用于若预设的图片推理服务器池中存在处于空闲状态的图片推理服务器,则控制处于空闲状态的图片推理服务器与所述客户端建立连接,以便于处于空闲状态的图片推理服务器对所述目标应答音频进行处理,得到所述目标应答音频对应的图片序列;

第二控制单元,用于在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与所述客户端的连接;

第一叠加单元,用于调用预设的静默视频服务器对所述图片序列和所述应答音频进行叠加处理,得到应答视频流;

第一发送单元,用于将所述应答视频流发送至所述客户端。

上述的装置,可选的,还包括:

第二叠加单元,用于若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

第二发送单元,用于将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

上述的装置,可选的,还包括:

写入单元,用于将所述目标应答音频写入预设的任务队列中;

所述第一控制单元具体用于:

从所述任务队列中获取所述目标应答音频;

控制处于空闲状态的图片推理服务器与所述客户端建立连接。

上述的装置,可选的,还包括:

返回单元,用于若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则返回执行所述判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器的步骤。

上述的装置,可选的,所述写入单元具体用于:

判断预设的任务队列中包括的应答音频的数量是否大于预设阈值;

若预设的任务队列中包括的应答音频的数量不大于预设阈值,则将所述目标应答音频写入预设的任务队列中。

上述的装置,可选的,还包括:

第三叠加单元,用于若预设的任务队列中包括的应答音频的数量大于预设阈值,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

第三发送单元,用于将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

上述的装置,可选的,所述获取单元具体用于:

识别所述问询音频,得到所述问询音频的文本信息;

从预设的应答文本库中查找与所述问询音频的文本信息相匹配的应答文本;

对所述应答文本进行音频合成处理,得到所述应答文本的应答音频;

将所述应答文本的应答音频确定为目标应答音频。

上述的装置,可选的,所述判断单元具体用于:

获取预设的图片推理服务器池中包括的每个图片推理服务器的运行指标;

基于每个图片推理服务器的运行指标,确定每个图片推理服务器中处于工作状态的处理器数量;

获取所述图片推理服务器池中包括的每个图片推理服务器的并发能力;

针对每个图片推理服务器,判断所述图片推理服务器中处于工作状态的处理器数量是否小于所述图片推理服务器的并发能力,若小于,则确定所述图片推理服务器处于空闲状态,若不小于,则确定所述图片推理服务器不处于空闲状态。

一种存储介质,所述存储介质存储有指令集,其中,所述指令集被处理器执行时实现如上述的服务器超卖实现方法。

一种电子设备,包括:

存储器,用于存储至少一组指令集;

处理器,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如上述的服务器超卖实现方法。

与现有技术相比,本申请包括以下优点:

本申请提供了一种服务器超卖实现方法及装置、存储介质及电子设备,该方法包括:在接收到客户端发送的问询音频后,获取与该问询音频对应的应答音频,并在预设的图片推理服务器池中存在处于空闲状态的图片推理服务器时,控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列,并在完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接,调用预设的静默视频服务器对图片序列和应答音频进行叠加处理,得到应答视频流,进而将应答视频流发送至客户端进行数字人应答视频渲染。可见,本申请方案,通过控制图片推理服务器与客户端连接的通断,实现利用处于空闲状态的图片推理服务器对应答音频进行处理,从而实现一个图片推理服务器可以为多个客户端提供服务,即实现对图片推理服务器的超卖,进而为服务器供应方创造更多的经济利益。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种服务器超卖实现方法的应用环境示意图;

图2为本申请提供的一种服务器超卖实现方法的方法流程图;

图3为本申请提供的一种服务器超卖实现方法的又一方法流程图;

图4为本申请提供的一种服务器超卖实现方法的又一方法流程图;

图5为本申请提供的一种服务器超卖实现方法的又一方法流程图;

图6为本申请提供的一种服务器超卖实现方法的又一方法流程图;

图7为本申请提供的一种服务器超卖实现方法的示例图;

图8为本申请提供的一种服务器超卖实现装置的结构示意图;

图9为本申请提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意,本申请公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意,本申请公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。

参阅图1,图1示出了一种适用于本申请实施例的应用环境示意图。本申请实施例提供的服务器超卖实现方法可以应用于如图1所述的交互系统。交互系统包括客户端101以及服务器102,客户端101与服务器102通信连接。其中,服务器102可以是多个服务器组成的服务器集群来实现。另外,服务器可以是云端服务器,还可以是传统服务器,在此不作具体限定。

其中,客户端101可以是具有显示屏且支持数据输入的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和可穿戴式电子设备等。具体的,数据输入可以是基于客户端101上具有的语音模块输入语音、字符输入模块输入字符、图像输入模块输入图像、视频输入模块输入视频等,还可以是基于客户端101上安装有的手势识别模块,使得用户可以实现手势输入等交互方式。

其中,客户端101上可以安装有客户端应用程序,用户可以基于客户端应用程序(例如APP、微信小程序等)与服务器102进行通信,具体的,服务器102上安装有对应的服务端应用程序,用户可以基于客户端应用程序在服务器102注册一个用户帐号,并基于该用户帐号与服务器102进行通信,例如用户在客户端应用程序登录用户帐号,并基于该用户帐号通过客户端应用程序进行信息输入,可以输入文字信息或语音信息等,客户端应用程序接收到用户输入的信息后,可以将该信息发送至服务器102,使得服务器102可以接收该信息并进行处理及存储,服务器102还可以接收该信息并根据该数据返回一个对应的输出信息至客户端101。

在一些实施方式中,客户端应用程序可以基于数字人与用户进行交互。具体的,客户端应用程序可以接收用户输入的信息,并通过数字人对该信息作出应答。其中,数字人是基于可视化图形的软件程序,该软件程序被执行后可以向用户呈现出模拟生物行为或思想的机器人形态。数字人可以是模拟真人式的数字人,例如根据用户自身或其他人的形态建立的形似真人的数字人,也可以是动漫效果式的数字人,例如动物形态或卡通人物形态的数字人。

在一些实施方式中,客户端101在获取与用户输入的信息对应的应答信息后,可以在客户端101的显示屏或与其连接的其他图像输出设备上显示对应与该应答信息的数字人图像,并可通过客户端101的扬声器或与其连接的其他音频输出设备播放与数字人图像对应的音频,还可以在客户端101的显示屏上显示与该回复信息对应的文字或图形,实现在图像、语音、文字等多个方面上与用户的多态交互。

上述应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。

参阅图2,本申请实施例提供了一种服务器超卖实现方法,该服务器超卖实现方法可以应用于上述交互系统,其执行主体可以为上述交互系统中的服务器102,该服务器超卖实现方法具体包括:

S201、在接收到客户端发送的问询音频后,获取目标应答音频。

本实施例中,用户通过预设信息输入方式向客户端输入咨询的问题,预设的信息输入方式包括但不限于文字输入或语音输入。客户端获取用户咨询的问题,其中,若用户的采用语音输入的方式输入咨询的问题,则直接获取用户输入咨询问题所发出的问询音频,并将该问询因为发送至服务器;若用户的采用非语音输入的方式输入咨询的问题,则将用户输入的咨询问题转化为问询音频,再将问询音频发送至服务器。

本实施例中,服务器接收客户端发送的问询音频,并在接收到问询音频后,获取目标应答音频,其中,目标音频为与问询音频对应的应答音频。

参阅图3,获取目标应答音频的过程,具体包括以下步骤:

S301、识别问询音频,得到问询音频的文本信息。

本实施例中,识别问询音频,得到问询音频的文本信息,也就是将问询音频转化为文本信息。

S302、从预设的应答文本库中查找与问询音频的文本信息相匹配的应答文本。

本实施例中,预设应答文本库,应答文本库中预选存储多个应答文本。

本实施例中,基于问询音频的文本信息,从应答文本库中查找与问询音频的文本信息相匹配的应答文本。

具体的,对问询音频的文本信息进行意图识别,得到文本信息中包含的用户意图,从应答文本库中查找与用户意图相匹配的应答文本。

S303、对应答文本进行音频合成处理,得到应答文本的应答音频。

本实施例中,对所查找到的应答文本进行音频合成处理,得到应答文本的应答音频,具体的,利用音频合成技术,对所查找到的应答文本进行音频合成处理,从而得到应答文本的应答音频。

S304、将应答文本的应答音频确定为目标应答音频。

本实施例中,将应答文本的应答音频确定为目标应答音频。

S202、判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器,若否,执行S203,若是,执行S204。

本实施例中,预设图片推理服务器池,图片推理服务器池中包括至少一个图片推理服务器,不同图片推理服务器可以具备相同的并发能力,也可以具备不同的并发能力,其中,并发能力用于表征图片推理服务器的路数,也就是图片推理服务器支持的处理器CPU的数量,例如,2路服务器,表征该服务器支持2个CPU。

参阅图4,判断预设的推片推理服务器池中是否存在处于空闲状态的图片推理服务器的过程,具体包括以下步骤:

S401、获取预设的图片推理服务器池中包括的每个图片推理服务器的运行指标。

本实施例中,获取预设的图片推理服务器池中包括的每个图片推理服务器的运行指标,每个图片推理服务器的运行指标包括但不限于CPU使用率进程数和内存。

S402、基于每个图片推理服务器的运行指标,确定每个图片推理服务器中处于工作状态的处理器数量。

本实施例中,针对每个图片推理服务器,基于该推片推理服务器的运行指标,确定该图片推理服务器中处于工作状态的处理器数量。

S403、获取图片推理服务器池中包括的每个图片推理服务器的并发能力。

本实施例中,获取图片推理服务器池中包括的每个图片推理服务器的并发能力,也就是获取每个图片推理服务器的支持的CPU的数量。

S404、针对每个图片推理服务器,判断图片推理服务器中处于工作状态的处理器数量是否小于图片推理服务器的并发能力,若是,执行S405,若否,执行S406。

本实施例中,针对每个图片推理服务器,将该图片推理服务器中处于工作状态的处理器数量与该图片推理服务器的并发能力进行比较,以判断图片推理服务器中处于工作状态的处理器数量是否小于图片推理服务器的并发能力。

S405、确定图片推理服务器处于空闲状态。

本实施例中,针对每个图片推理服务器,若该图片推理服务器中处于工作状态的处理器数量小于该图片推理服务器的并发能力,则说明该图片推理服务器存在处于空闲状态的处理器,从而确定该图片推理服务器处于空闲状态。

例如,图片推理服务器池中包括图片推理服务器1,其中,图片推理服务器1支持2路CPU,若图片推理服务器1中处于工作状态的CPU数量为1,则确定出图片推理服务器处于空闲状态。

S406、确定图片推理服务器不处于空闲状态。

本实施例中,针对每个图片推理服务器,若该图片推理服务器中处于工作状态的处理器数量不小于该图片推理服务器的并发能力,则说明该图片推理服务器的所有处理器均处于工作状态,从而确定该图片推理服务器不处于空闲状态。

例如,图片推理服务器池中包括图片推理服务器1,其中,图片推理服务器1支持2路CPU,若图片推理服务器1中处于工作状态的CPU数量为2,则确定出图片推理服务器不处于空闲状态。

S203、调用预设的静默视频服务器,对目标应答音频和预设的静默视频进行叠加处理,得到应答视频流。

本实施例中,预设静默视频,静默视频为不包含音频,只包含数字人动作的视频。其中,动作包括但不限于嘴型动作和肢体动作。

本实施例中,若图片推理服务器池中不存在处于空闲状态的图片推理服务器,则调用预设的静默视频服务器,对目标应答音频和预设的静默视频进行叠加处理,从而得到应答视频流。

其中,应答视频流包括数字人动作和音频。

S204、控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列。

本实施例中,若图片推理服务器池中存在处于空闲状态的图片推理服务器,则控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列,具体的,控制任意一个处于空闲状态的图片推理服务器与客户端建立连接,从而与该客户端建立连接的图片推理服务器对该目标应答音频进行处理,得到目标应答音频对应的图片序列。

其中,图片序列中的每张图片包括数字人的动作。

S205、在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接。

本实施例中,判断处于空闲状态的图片推理服务器是否完成对目标应答音频的处理,若未完成,则返回判断处于空闲状态的图片推理服务器是否完成对目标应答音频的处理,直至处于空闲状态的图片推理服务器完成对目标应答音频的处理。

本实施中,在确定出处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接,从而使得该图片推理服务器后续可用于为其他客户端提供服务器。

S206、调用预设的静默视频服务器对图片序列和应答音频进行叠加处理,得到应答视频流。

本实施例中,调用预设的静默视频服务器对图片序列和应答音频进行叠加处理,从而得到应答视频流。

其中,应答视频流包括数字人动作和音频。

S207、将应答视频流发送至客户端,以便于客户端渲染与应答视频流对应的数字人应答视频。

本实施例中,在得到应答视频流后,将应答视频流发送至客户端。

本实施例中,客户端在接收到应答视频流后,在客户端中渲染与应答视频流对应的数据人应答视频。

本申请实施例提供的服务器超卖实现方法,通过控制图片推理服务器与客户端连接的通断,实现利用处于空闲状态的图片推理服务器对应答音频进行处理,从而实现一个图片推理服务器可以为多个客户端提供服务,即实现对图片推理服务器的超卖,进而为服务器供应方创造更多的经济利益。

参阅图5,本申请实施例还提供了另一种服务器超卖实现方法,具体包括以下步骤:

S501、在接收到客户端发送的问询音频后,获取目标应答音频。

可选的,步骤S501的具体实现过程如步骤S201所述,此处不再赘述。

S502、将目标应答音频写入预设的任务队列中。

本实施例中,预设任务队列,任务队列用于临时存储应答音频。

本实施例中,在获取目标应答音频后,将目标应答音频写入预设的任务队列中。

S503、判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器,若是,执行S504,若否,返回执行S503。

可选的,步骤S503的具体实现过程如步骤S202所述,此处不再赘述。

本实施例中,若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则返回执行步骤S503,直至图片推理服务器池中存在处于空闲状态的图片推理服务器。

S504、从任务队列中获取目标应答音频。

本实施例中,若执行至任务队列中的目标应答音频,并且图片推理服务器池中存在处于空闲状态的图片推理服务器,则从任务队列中获取目标应答音频,也就是从任务队列中读取目标应答音频。

S505、控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列。

本实施例中,在从任务队列中获取目标应答音频后,控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列,具体的,控制任意一个处于空闲状态的图片推理服务器与客户端建立连接,从而与该客户端建立连接的图片推理服务器对该目标应答音频进行处理,得到目标应答音频对应的图片序列。

S506、在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接。

可选的,步骤S506的具体实现过程如步骤S205所述,此处不再赘述。

S507、调用预设的静默视频服务器对图片序列和应答音频进行叠加处理,得到应答视频流。

可选的,步骤S507的具体实现过程如步骤S206所述,此处不再赘述。

S508、将应答视频流发送至客户端,以便于客户端渲染与应答视频流对应的数字人应答视频。

本实施例中,将应答视频流发送至客户端,客户端在接收到应答视频流后,在客户端中渲染与应答视频流对应的数据人应答视频。

本申请实施例提供的服务器超卖实现方法,预设任务队列,将目标应答音频写入预设的任务队列中进行排队,等待处于空闲状态的图片推理服务器对该目标应答音频进行处理,从而提高后续客户端渲染得到的数字人视频中数字人动作和音频的同步性。

参阅图6,本申请实施例还提供了另一种服务器超卖实现方法,具体包括以下步骤:

S601、在接收到客户端发送的问询音频后,获取目标应答音频。

可选的,步骤S601的具体实现过程如步骤S201所述,此处不再赘述。

S602、判断预设的任务队列中包括的应答音频的数量是否大于预设阈值,若是,执行S603,若否,执行S604。

本实施例中,本实施例中,预设任务队列,任务队列用于临时存储应答音频。

本实施例中,确定预设的任务队列中当前包括的应答音频的数量,将任务队列中当前包括的应答音频的数量与预设阈值进行比对,以判断预设的任务队列中包括的应答音频的数量是否大于预设阈值。

S603、调用预设的静默视频服务器,对目标应答音频和预设的静默视频进行叠加处理,得到应答视频流。

本实施例中,若任务队列中包括的应答音频的数量大于预设阈值,则调用预设的静默视频服务器,对目标应答音频和预设的静默视频进行叠加处理,从而得到应答音频对应的应答视频流。

S604、将目标应答音频写入预设的任务队列中。

本实施例中,若预设的任务队列中包括的应答音频的数量不大于预设阈值,则将目标应答音频写入预设的任务队列中。

S605、判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器,若是,执行S606,若否,执行S605。

可选的,步骤S605的具体实现过程如步骤S202所述,此处不再赘述。

S606、从任务队列中获取目标应答音频。

本实施例中,若执行至任务队列中的目标应答音频,并且图片推理服务器池中存在处于空闲状态的图片推理服务器,则从任务队列中获取目标应答音频,也就是从任务队列中读取目标应答音频。

S607、控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列。

本实施例中,在从任务队列中获取目标应答音频后,控制处于空闲状态的图片推理服务器与客户端建立连接,以便于处于空闲状态的图片推理服务器对目标应答音频进行处理,得到目标应答音频对应的图片序列,具体的,控制任意一个处于空闲状态的图片推理服务器与客户端建立连接,从而与该客户端建立连接的图片推理服务器对该目标应答音频进行处理,得到目标应答音频对应的图片序列。

S608、在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与客户端的连接。

可选的,步骤S608的具体实现过程如步骤S205所述,此处不再赘述。

S609、调用预设的静默视频服务器对图片序列和应答音频进行叠加处理,得到应答视频流。

S610、将应答视频流发送至客户端,以便于客户端渲染与应答视频流对应的数字人应答视频。

本实施例中,将应答视频流发送至客户端,客户端在接收到应答视频流后,在客户端中渲染与应答视频流对应的数据人应答视频。

本申请实施例提供的服务器超卖实现方法,若任务队列中包括的应答音频不大于预设阈值,则先通过图片推理服务器对目标应答音频进行处理,得到图片序列,再调用静默视频服务器,对图片序列和目标应答音频进行叠加处理,得到应答视频流,若任务队列中包括的应答音频大于预设阈值,则直接调用静默视频服务器,对预设静默视频和目标应答音频进行叠加处理,得到应答视频流,从而提高应答视频流输出的效率,进而提高数字人视频渲染的效率。

参阅图7,对上述本申请实施例提供的服务器超卖实现方法的具体实现过程进行举例说明如下:

用户通过客户端咨询问题,客户端采集用户咨询问题的问询音频,并通过网关将问询音频发送至服务器中的中控模块。

中控模块将该问询音频传输至服务器中的应答音频获取模块,应答音频获取模块识别问询音频,得到问询音频的文本信息,从预设的应答文本库中查找与问询音频的文本信息相匹配的应答文本,并对应答文本进行音频合成处理,得到应答文本的应答音频,并将该应答音频传输至中控模块。

中控模块在接收到应答音频后,判断服务器中的预设图片推理服务器池中是否存在处于空闲状态的图片推理服务器,若存在处于空闲状态的图片推理服务器,则将该应答音频传输至处于空闲状态的图片推理服务器,处于空闲状态的图片推理服务器对应答音频进行处理,得到应答音频的图片序列(也就是图片流),并将该图片流反馈至中控模块,中控模块将该图片流和应答音频传输至服务器中的静默视频服务器,静默视频服务器对图片流和应答音频进行叠加处理,得到音视频流,并将该音视频流传输至服务器中的流媒体服务器;若不存在处于空闲状态的图片推理服务器,则将该应答音频传输至静默视频服务器,静默视频服务器对预设的静默视频和该应答音频进行叠加处理,得到音视频流,并将该音视频流传输至流媒体服务器。

流媒体服务器在接收到音视频流后,将该音视频流发送至客户端,从而客户端在接收到该音视频流后,在客户端中渲染与音视频流对应的数据人应答视频。

需要说明的是,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。

应当理解,本申请公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请公开的范围在此方面不受限制。

与图1所述的方法相对应,本申请实施例还提供了一种服务器超卖实现装置,用于对图1中方法的具体实现,其结构示意图如图8所示,具体包括:

获取单元801,用于在接收到客户端发送的问询音频后,获取目标应答音频;所述目标应答音频为与所述问询音频对应的应答音频;

判断单元802,用于判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器;

第一控制单元803,用于若预设的图片推理服务器池中存在处于空闲状态的图片推理服务器,则控制处于空闲状态的图片推理服务器与所述客户端建立连接,以便于处于空闲状态的图片推理服务器对所述目标应答音频进行处理,得到所述目标应答音频对应的图片序列;

第二控制单元804,用于在处于空闲状态的图片推理服务器完成对目标应答音频的处理后,控制断开处于空闲状态的图片推理服务器与所述客户端的连接;

第一叠加单元805,用于调用预设的静默视频服务器对所述图片序列和所述应答音频进行叠加处理,得到应答视频流;

第一发送单元806,用于将所述应答视频流发送至所述客户端。

本申请实施例提供的服务器超卖实现装置,通过控制图片推理服务器与客户端连接的通断,实现利用处于空闲状态的图片推理服务器对应答音频进行处理,从而实现一个图片推理服务器可以为多个客户端提供服务,即实现对图片推理服务器的超卖,进而为服务器供应方创造更多的经济利益。

在本申请的一个实施例中,基于前述方案,还可以配置为:

第二叠加单元,用于若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

第二发送单元,用于将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

在本申请的一个实施例中,基于前述方案,还可以配置为:

写入单元,用于将所述目标应答音频写入预设的任务队列中;

第一控制单元803具体用于:

从所述任务队列中获取所述目标应答音频;

控制处于空闲状态的图片推理服务器与所述客户端建立连接。

在本申请的一个实施例中,基于前述方案,还可以配置为:

返回单元,用于若预设的图片推理服务器池中不存在处于空闲状态的图片推理服务器,则返回执行所述判断预设的图片推理服务器池中是否存在处于空闲状态的图片推理服务器的步骤。

在本申请的一个实施例中,基于前述方案,写入单元具体用于:

判断预设的任务队列中包括的应答音频的数量是否大于预设阈值;

若预设的任务队列中包括的应答音频的数量不大于预设阈值,则将所述目标应答音频写入预设的任务队列中。

在本申请的一个实施例中,基于前述方案,还可以配置为:

第三叠加单元,用于若预设的任务队列中包括的应答音频的数量大于预设阈值,则调用预设的静默视频服务器,对所述目标应答音频和预设的静默视频进行叠加处理,得到应答视频流;

第三发送单元,用于将所述应答视频流发送至所述客户端,以便于所述客户端渲染与所述应答视频流对应的数字人应答视频。

在本申请的一个实施例中,基于前述方案,获取单元801具体用于:

识别所述问询音频,得到所述问询音频的文本信息;

从预设的应答文本库中查找与所述问询音频的文本信息相匹配的应答文本;

对所述应答文本进行音频合成处理,得到所述应答文本的应答音频;

将所述应答文本的应答音频确定为目标应答音频。

在本申请的一个实施例中,基于前述方案,判断单元802具体用于:

获取预设的图片推理服务器池中包括的每个图片推理服务器的运行指标;

基于每个图片推理服务器的运行指标,确定每个图片推理服务器中处于工作状态的处理器数量;

获取所述图片推理服务器池中包括的每个图片推理服务器的并发能力;

针对每个图片推理服务器,判断所述图片推理服务器中处于工作状态的处理器数量是否小于所述图片推理服务器的并发能力,若小于,则确定所述图片推理服务器处于空闲状态,若不小于,则确定所述图片推理服务器不处于空闲状态。

本申请实施例还提供了一种存储介质,所述存储介质存储有指令集,其中,在所述指令集运行时执行如上文任一实施例公开的服务器超卖实现方法。

本申请实施例还提供了一种电子设备,其结构示意图如图9所示,具体包括存储器901,用于存储至少一组指令集;处理器902,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如上文任一实施例公开的服务器超卖实现方法。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

以上描述仅为本申请公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号