首页> 中国专利> 一种语音助手执行本地任务的方法及语音助手

一种语音助手执行本地任务的方法及语音助手

摘要

本发明公开了语音助手执行本地任务的方法及语音助手,所述方法包括:当所述语音助手处于用户通话模式时,所述语音助手执行所述本地任务指令,将第一执行结果通知给用户,所述语音助手继续接收下一轮的第一用户的语音指令,并确定该语音指令为通话内容指令,接收下一轮的第二用户的第二通话语音;判断上述接收的通话内容指令和/或第二通话语音是否包括所述执行过的本地任务指令的更新信息,如果是,根据所述更新信息替换所述执行过的本地任务指令中的全部或部分信息,生成第二本地任务指令,执行所述第二本地任务指令,将第二执行结果通知给用户。通过上述方法及语音助手,提高了用户体验。

著录项

  • 公开/公告号CN112261234A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 北京蓦然认知科技有限公司;

    申请/专利号CN202011147839.X

  • 发明设计人 张伟萌;李国华;

    申请日2020-10-23

  • 分类号H04M3/493(20060101);G10L15/22(20060101);

  • 代理机构11810 北京智丞瀚方知识产权代理有限公司;

  • 代理人任冠举

  • 地址 100083 北京市海淀区学院路5号中关村768创意产业园A座3号门

  • 入库时间 2023-06-19 09:38:30

说明书

技术领域

本发明实施例涉及信息处理技术领域,特别涉及一种语音助手执行本地任务的方法及语音助手。

背景技术

近年来,随着人工智能的发展,语音助手也能够向用户提供越来越丰富的服务,例如,语音助手能够代替用户接听电话,并将通话内容以语音或文本的方式提供给用户,供用户查看或收听。但是现有技术中语音助手代替用户接听通话时存在如下不足:

1、在语音助手和主叫用户的通话过程中,用户可以实时查看或收听通话内容,根据自身意愿随时都可以介入通话,此时,通话的参与方由语音助手和主叫用户变更为被叫用户和主叫用户,语音助手处于中止状态,不再参与通话。此后,若用户再次需要语音助手代替自己与主叫用户进行通话,此时,由于语音助手无法获取用户先前与被叫用户的通话内容,导致语音助手无法与主叫用户进行流畅的对话,通话效果不佳。

2、现有技术中,用户能够对语音助手给出的答复进行一定的控制,在语音助手和主叫用户的通话中涉及到被叫用户的隐私时,语音助手能够提示用户,并根据用户的响应答复主叫用户,例如,当主叫用户询问被叫用户的地址时,语音助手询问主叫用户“是否将地址提供给对方”,若主叫用户选择不提供,则语音助手答复被叫用户“对不起,地址不方便提供”。然而上述方式中,哪些情况下需要提示用户,需要预先设置或配置,无法满足用户对处于通话中的语音助手的多样化控制需求。

3、现有技术并未考虑通话和用户与语音助手的对话同时进行的场景。一种典型的场景是,在接到来电之前,用户与语音助手存在语音对话,例如,用户正通过语音助手查询机票,在接收到来电并由语音助手接听该来电时,若用户发出语音输入,则语音助手无法判断该语音指令是用于继续用户与语音助手的语音对话,还是用于控制语音助手在通话中给主叫用户的应答。另一种典型的场景是在用户在通话过程中存在与语音助手的对话需求,例如,当主叫用户询问被叫用户明天是否有空时,被叫用户想通过询问语音助手来确定自己明天是否有空,于是发出语音指令“我明天是否有空”,该语音指令应当发送给语音助手,但此时,移动终端无法确定用户的语音输入究竟是发送给主叫用户还是发送给语音助手。在通话和用户与语音助手的对话同时进行的场景下,具体应当如何处理用户的语音输入,现有技术并未意识到上述问题,也并未给出相应的解决方案。

发明内容

针对现有技术中的问题,本发明提供一种语音助手参与通话的方法及语音助手。

本发明提供一种语音助手执行本地任务的方法,所述方法包括:

步骤1,当所述语音助手处于用户通话模式时,所述语音助手接收第一用户的语音指令并确定所述语音指令为通话内容指令时,语音助手将所述通话内容指令作为第三通话语音发送给第二用户;所述语音助手接收第二用户的第二通话语音,并将其提供给第一用户;

步骤2,所述语音助手再次接收第一用户的语音指令并判断其为本地任务指令;

步骤3,所述语音助手执行所述本地任务指令,将第一执行结果通知给用户;

步骤4,所述语音助手继续接收下一轮的第一用户的语音指令,并确定该语音指令为通话内容指令,接收下一轮的第二用户的第二通话语音;

步骤5,判断所述步骤4中接收的通话内容指令和/或第二通话语音是否包括所述执行过的本地任务指令的更新信息,如果是,执行步骤6;

步骤6,根据所述更新信息替换所述执行过的本地任务指令中的全部或部分信息,生成第二本地任务指令,执行所述第二本地任务指令,将第二执行结果通知给用户。

一种执行本地任务的语音助手,其特征在于,所述语音助手处于用户通话模式,所述语音助手包括收发单元、处理单元;

收发单元,还用于接收第一用户的语音指令,接收第二用户的第二通话语音并将其提供给用户,响应于所述处理单元的触发,将所述第三通话语音发送给第二用户;

所述处理单元,还用于判断所述语音指令为通话内容指令时,将所述通话内容指令作为第三通话语音,触发所述收发单元将所述第三通话语音发送给第二用户;

所述收发单元,还用于再次接收的第一用户的语音指令;

所述处理单元,还用于判断所述再次接收的语音指令是否为本地任务指令,如果是,则执行所述本地任务指令,触发所述收发单元将第一执行结果通知给用户;

所述收发单元,还用于响应于所述处理单元的触发,将第一执行结果通知给用户;

收发单元,还用于接收下一轮的第一用户的语音指令,接收下一轮的第二用户的第二通话语音;

所述处理单元,还用于确定所述下一轮的第一用户的语音指令为通话内容指令,判断所述通话内容指令和/或所述下一轮的第二用户的第二通话语音是否包括上述执行过的本地任务指令的更新信息,如果是,根据所述更新信息替换所述执行过的本地任务指令中的全部或部分信息,生成第二本地任务指令,执行所述第二本地任务指令,触发所述收发单元将第二执行结果通知给用户;

所述收发单元,还用于响应于所述处理单元的触发,将第二执行结果通知给用户。

本发明还提供了一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如上所述的方法。

本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。

本发明还提供了一种终端,其特征在于,包括如上所述的语音助手。

通过上述方法,根据用户与主叫的语音通话内容自动更新本地任务指令,能够减少用户答复主叫用户的时延,提升用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例中的语音助手系统。

图2是本发明一个实施例中的语音助手的工作模式切换方法。

图3是本发明一个实施例中的语音助手参与通话的方法。

图4是本发明一个实施例中的语音助手。

图5是本发明一个实施例中的语音助手参与通话的方法。

图6是本发明一个实施例中的语音助手识别并执行用户指令的方法。

图7是本发明一个实施例中的语音助手执行本地任务的方法。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明的实施例以及实施例的具体特征是对本发明实施例技术方案的详细说明,而非对本发明说明书技术方案的限定,在不冲突的情况下,本发明的实施例以及实施例的技术特征可以相互结合。

1、语音助手系统

图1示出了语音助手系统的框图,所述语音助手系统可以在独立的设备上实现,也可以跨多个设备来实现。在某些实施例中,所述语音助手系统的部分模块、单元或功能属于服务器,其余部分模块、单元或功能属于终端,所述终端可通过一个或多个网络与所述服务器进行通信。在某些实施例中,语音助手系统的部分模块,例如处理单元102、交互引擎112,可以既属于服务器,也属于终端,其余部分模块属于服务器或终端中的一者。

所述语音助手系统主要包括:收发单元101,处理单元102,数据库103等。其中,处理单元包含n个交互引擎112,n为大于等于1的正整数,每个交互引擎112可以包含语义理解模块201,对话管理和控制模块202,对话生成模块203,命令执行模块204。其中,处理单元102与收发单元101相互连接,可以通过收发单元101接收用户输入的数据,以及通过收发单元101向用户输出交互数据,例如,反馈给用户的对话数据、任务执行过程及结果。在所述语音助手代替用户进行通话如接听呼叫时,所述收发单元还用于从例如移动终端的通信单元等部件接收对端用户的通话语音,从用户指令采集单元如输入法或麦克风等部件接收语音助手用户的指令,并将语音助手生成的或从语音助手用户接收到的通话语音通过移动终端的通信单元等部件发送给对端用户。即本发明中收发单元101用于语音助手接收和/或发送消息,语音助手的其余功能均由处理单元来完成。收发单元101可以包括人机交互界面等。

在某些实施例中,交互引擎112可以包括一个交互主引擎和/或至少一个交互子引擎。其中,交互主引擎为语音助手系统的默认引擎。服务器上的交互子引擎可以是语音助手系统自有,也可以由终端在本地训练生成并通过专有接口上传,终端中的交互子引擎可以是语音助手系统自有,也可以由终端本地训练生成并加载在语音助手系统中,还可以是终端从服务器下载并加载在语音助手系统中。

在某些实施例中,每个交互引擎(交互主引擎、交互子引擎)能够执行至少一种任务,即每个交互引擎可以与至少一个任务相关联,不同的交互子引擎所能够执行的任务可能相同或不同。交互引擎针对与其相关联的每一个任务定义了至少一个槽位。终端可以根据用户需要从服务器下载一个或多个交互子引擎,并加载在终端的语音助手系统中,典型的交互子引擎示例如下:

天气交互子引擎可执行的任务为天气查询,其针对天气查询任务所定义的槽位为城市和日期,用户可以下载天气交互子引擎,并与天气交互子引擎进行交互以查询城市天气预报;

音乐交互子引擎可执行的任务为音乐播放,针对音乐播放任务所定义的槽位包括歌手姓名和歌曲名称,用户可以下载音乐交互子引擎,并与音乐交互子引擎进行交互以按照用户要求播放音乐;

来电接听子引擎可执行的任务为来电接听任务,包括以各种不同的通话模式接听来电并向用户提供通话内容的记录等。针对该任务所定义的槽位包括来电人身份、社会关系等,此外,来电接听子引擎针对该任务还可以定义至少一个来电意图槽位组,不同来电意图槽位组所针对的来电意图不同,其中包括的子槽位也不同,例如,针对问候来电意图槽位组,其包括来电意图子槽位(该子槽位此时默认填为问候)、问候人子槽位、被问候人子槽位等,针对快递派送来电意图槽位组,其包括来电意图子槽位(该槽位此时默认填为快递派送)、时间子槽位、地点子槽位、快递公司子槽位、包裹尺寸子槽位等。用户可以下载来电接听子引擎,并利用来电接听子引擎接听来电,来电接听子引擎具体的工作模式在下文中进行具体描述。当检测到来电时,语音助手或语音助手的交互主引擎自动触发或调用来电接听子引擎,来电接听子引擎或交互主引擎根据来电接听规则确定该来电应当由用户来接听,还是由语音助手来接听,但无论是由用户接听来电,还是语音助手接听来电,只要来电被接通、与主叫用户建立通话,所述来电接听子引擎均为该通话建立一个通话会话进程,以与被叫用户与语音助手的本地对话进程所区分开来。在某些通话模式下,来电接听子引擎在接收到主叫用户的第二通话语音后,对其进行语音识别和语义识别,基于识别结果填充通话任务对应的槽位,并根据槽位填充结果生成备选通话语音或第三通话语音,与主叫用户进行多轮对话。

主呼子引擎可执行的任务为主呼任务,具体的,主呼子引擎代替主叫用户主动呼叫被叫用户,并全部或部分代替主叫用户与被叫用户进行通话。针对该任务定义的槽位包括被叫用户号码、被叫用户类别、主呼意图等。用户可以下载主呼子引擎,并利用主呼子引擎进行自动呼叫。当被叫用户应答呼叫后,所述主呼子引擎与被叫用户建立通话,为该通话建立一个通话会话进程,以与用户与语音助手的本地对话进程所区分开来。

上述来电接听任务和主呼任务均属于通话任务。本发明中,将语音助手能够执行的、除通话任务以外的其他任务称为本地任务,用户可以通过本地任务指令来触发本地任务,所述本地任务指令不属于所述通话会话进程,其作用是使得语音助手执行特定的其他任务,即所述本地任务,但这并不意味着所述本地任务指令与主叫用户和被叫用户的通话内容无关,而仅仅是指不需要将该本地任务指令加载到通话会话进程从而不需要将其发送给第二用户,也不需要将本地任务的执行结果加载到通话会话进程。例如,语音助手的来电接听子引擎处于用户通话模式且主叫用户询问被叫用户明天是否有空时,被叫用户想通过询问语音助手来确定自己明天是否有空,于是发出语音指令“静音,我明天是否有空”,该语音指令即为本地任务指令,其将会触发主引擎或者日程子引擎执行本地任务即日程查询任务,以确定用户明天的日程,并向用户答复查询结果如“明天下午有空”。值得注意的是,上述本地任务指令和本地任务中“本地”的含义仅仅用于说明该任务并非通话任务,而并非是指在执行该任务时语音助手不需要接入网络并利用网络中的信息。

针对本地任务,用户可通过语音或者文字等方式与语音助手系统进行交互,语音助手系统根据用户的指令确定用户意图(即确定任务),确定与该用户意图相关联的各个槽位相应的关键知识数据,并将所述关键知识数据填充到相应的槽位中。随后,语音助手系统基于填充好的一个或多个槽位执行该任务。

在某些实施例中,交互主引擎只基于用户指令确定能够处理该用户指令的交互子引擎,其自身不执行具体的任务。因此,在上述本地任务过程中确定用户意图可以由语音助手系统中的交互主引擎来完成,交互主引擎还用于基于确定出的用户意图选择一个或多个交互子引擎来处理上述用户指令,上述过程中的槽位填充和本地任务执行由交互主引擎确定出的一个或多个交互子引擎来执行。

在某些实施例中,上述来电接听子引擎的功能由交互主引擎来完成,即不设立单独的来电接听子引擎。

2、通话模式

本发明的语音助手能够提供三种通话模式,分别为语音助手通话模式、辅助通话模式、用户通话模式。

本发明中,无论采用哪种通话模式,语音助手均为该通话建立会话进程,称为通话会话进程,即无论采用哪种通话模式,语音助手均参与到通话中,但在不同的通话模式下,语音助手参与通话的方式不同,这将在下文中具体描述。

下文中,主叫用户和第二用户指代相同,二者在任意场景下可以相互替代,被叫用户、语音助手的使用者、第一用户指代相同,三者在任意场景下可以相互替代。下文中,若未明确指明为主叫用户或第二用户,提及的用户均指代第一用户。

本发明中,将主叫用户在通话中的语音称为第二通话语音,针对所述第二通话语音,语音助手向主叫用户发送第三通话语音作为对第二通话语音的响应,其中,在不同通话模式下,语音助手生成或获取第三通话语音的过程不同,这将在下文中具体描述。

无论处于哪种通话模式,在通话进行过程中,语音助手可以从第一用户接收用户指令。所述用户指令可以为模式切换指令、本地任务指令、通话内容指令中的一者或多者。移动终端的用户指令采集单元如输入法或麦克风采集到用户指令后将其发送给语音助手,语音助手判断所述用户指令的类型为上述一者或多者中的哪一者,并根据指令的类型来执行相应的操作,用户指令可以为语音指令或文本指令。此外,模式切换指令还可以为用户通过虚拟按键或实体按键生成。

现有技术中将通话过程中移动终端采集到的所有用户语音均发送给第二用户。而本发明中,无论处于哪种通话模式下,在通话过程中,移动终端采集到的用户指令均先发送给语音助手(如语音助手的收发单元),经语音助手判断用户指令为通话内容指令时,按照通话模式对应的方式基于通话内容指令生成第三通话语音发送给主叫用户,经语音助手判断用户指令为本地任务指令时,执行本地任务,从而确保了用户在通话过程中,也能够同时控制语音助手执行本地任务。经语音助手判断用户指令为模式切换指令时,切换所述语音助手的通信模式。

优选的,模式切换指令包括想要切换到的通话模式,或者,模式切换指令与想要切换到的通话模式对应。例如,语音助手在语音助手通话模式下接收到用户的模式切换指令,其中携带辅助通话模式,或者模式切换指令对应辅助通话模式,例如在通过与辅助通话模式对应的按键生成模式切换指令的情况下,则语音助手切换到辅助通话模式下,其他两个模式也是类似。图2示出了通过模式切换指令在三个通话模式之间切换的过程。在另一个实施例中,将上述三个通话模式排序形成有向环,模式切换指令只表征需要切换通话模式,而不携带具体要切换到哪个通话模式的指令,例如,上述有向环为:语音助手通话模式—>辅助通话模式—>用户通话模式—>语音助手通话模式,即若语音助手当前处于语音助手通话模式,从用户处接收到模式切换指令后,语音助手将切换到辅助通话模式,在辅助通话模式下,接收到模式切换指令后,将切换到用户通话模式,在用户通话模式下,接收到模式切换指令后,将切换到语音助手通话模式,以此类推。如前所述,所述模式切换指令可以为语音、文本,用户也可以通过触摸或按压位于移动终端上的虚拟按键或实体键生成模式切换指令。除了模式切换指令外,本发明还可以采用其他机制实现不同通话模式之间的自动切换。

优选的,在通话进行过程中,语音助手可以从第一用户接收本地任务指令,本地任务指令是与本地任务有关的用户指令。语音助手在接收到本地任务指令后,当用户与语音助手之间存在与所述任务指令相关联的本地会话进程时,将所述任务指令加载到所述本地会话进程中进行处理,当用户与语音助手之间不存在与所述任务指令相关联的本地会话进程时,新建一个本地会话进程,并加载所述任务指令。具体的,所述语音助手在接收到用户指令后,判断所述用户指令是否包括本地任务指令标识词,如果是,确定所述用户指令不属于所述通话会话进程,将所述任务指令加载到所述语音助手的本地会话进程中。

优选的,不在通话进行过程中时,用户发出本地任务指令不需要携带上述本地任务指令标识词。

优选的,所述通话内容指令是与响应第二通话语音有关的指令,语音助手处于不同通话模式时,接收到通话内容指令后操作也相应的不同,将在下文中进一步详细描述。

(1)语音助手通话模式

当根据来电接听规则确定来电应当由语音助手来接听时,语音助手接通所述来电,并自动工作于语音助手通话模式下。在语音助手通话模式下,语音助手代替用户与主叫用户进行通话,即由语音助手对接收到的第二通话语音进行响应。具体的,语音助手接通来电以与主叫用户建立通话,并为该通话新建一个通话会话进程。此后,语音助手接收主叫用户的第二通话语音,并生成第三通话语音发送给主叫用户,以响应所述主叫用户的第二通话语音。同时,语音助手实时地将包括上述第二通话语音和第三通话语音的通话内容提供给用户,供用户查看或收听。所述通话内容可以为语音或文本。

在语音助手通话模式下,来电接听子引擎在接收到主叫用户的第二通话语音后,对其进行语音识别和语义识别,基于识别结果填充通话任务对应的槽位,并根据槽位填充结果生成第三通话语音。同时,在语音助手通话模式下,语音助手为第一用户保留了一个间接参与通话的机制,用户可以通过通话内容指令改变语音助手生成第三通话语音的逻辑(也可以称为“决策图状态”),使得通话过程能够按照用户期望的方向进行下去。具体的,在接收到用户的通话内容指令后,对该通话内容指令进行语音识别或进行语音识别和语义识别,确定用户插入该指令的意图,改变生成第三通话语音的逻辑,根据改变后的逻辑生成第三通话语音,给出与未接收到通话内容指令时不同的答复或响应。

用户插入通话内容指令的时机可以为通话过程中的任意时机,如接收到一条第二通话语音,但语音助手尚未针对该条第二通话语音进行答复,或语音助手针对上一条第二通话语音进行了答复但尚未收到下一条第二通话语音之前。例如,若主叫用户为中介,接收到的第二通话语音为“张先生,今天给您推荐两套房子”,语音助手生成的第三通话语音为“好的,您说”,随后,语音助手接收到的第二通话语音为“第一套房子在中心花园小区,89平,价格是450万”,语音助手生成的第三通话语音为“这套房子几层?有电梯吗?”,现有技术中的语音助手会一直不停的询问下去,直到需要的信息均被记录进而结束通话或用户接管通话。而在本申请中,用户实时查看了语音助手提供的通话内容,在获得房子位于中心花园小区后给出通话内容指令“我对这个小区不感兴趣”,则语音助手确定用户意图为询问第二套房子的情况,因此,生成的第三通话语音为“第二套房子呢?”;此后,在接收到下一条第二通话语音之前,用户再次给出通话内容指令“尽快结束通话”,则在接收到第二通话语音“第二套房子在荣欣小区,110平,价格是550万,次顶层”后,由于基于通话内容指令改变了生成第三通话语音的逻辑,因此,语音助手不会生成“这套房子有电梯吗”的第三通话语音,而是会生成“好的,我再考虑一下,多谢,再见”的第三通话语音。

在语音助手通话模式下,语音助手生成第三通话语音的过程中,调用其他交互引擎,生成第三通话语音还基于其他交互引擎给出的任务执行结果。

在本次通话过程中且语音助手处于语音助手通话模式的持续期间,当用户给出通话内容指令的次数符合第一预设规则时,则语音助手所处的通话模式自动从语音助手通话模式切换为辅助通话模式,此时,语音助手采用第一提示方式向用户提示该通话模式的自动切换,所述第一提示方式可以为声音、震动、语音或文字中的一种或多种。上述第一预设规则可以为:用户在第一预设时间内给出通话内容指令的次数超过第一预设数量;或;用户连续针对第二预设数量条第二通话语音均给出相应的通话内容指令等。

在语音助手工作模式下,在接收到用户的模式切换指令后,所述语音助手切换其工作模式为辅助通话模式或用户通话模式。

值得注意的是,在本申请中,语音助手的通话模式泛指其工作的模式,其可以为三种通话模式之一,而语音助手通话模式特指语音助手代替用户与主叫用户进行通话且为用户保留间接参与通话机制的这一种通话模式。

(2)辅助通话模式

在辅助通话模式下,语音助手为第一用户保留了一个直接参与通话的机制,第一用户可以通过通话内容指令参与到语音助手与主叫用户的通话过程中。在辅助通话模式下,语音助手在接收到来自主叫用户的第二通话语音时,生成第三通话语音并将其发送给主叫用户。所述生成过程具体为:在接收到主叫用户的第二通话语音时,启动计时器,并生成备选通话语音,若在计时器到期之前,接收到第一用户的通话内容指令,则将所述通话内容指令作为第三通话语音发送给主叫用户,否则,将所述备选通话语音作为第三通话语音发送给主叫用户。即在辅助通话模式下,由语音助手和/或用户对接收到的第二通话语音进行响应。

在前述中介电话的场景下,若语音助手处于辅助通话模式,用户没有给出通话内容指令时的执行过程与语音助手通话模式相同,而当用户给出通话内容指令“我对这个小区不感兴趣”时,语音助手将所述通话内容指令作为第三通话语音发送给主叫用户。

在辅助通话模式下,若在计时器到期之前,接收到第一用户的通话内容指令,除将所述通话内容指令作为第三通话语音发送给主叫用户,语音助手还对比所述通话内容指令和所述备选通话语音,修改或更新通话任务对应的槽位填充内容,以使得后续生成的备选通话语音更加贴合用户。

在辅助通话模式下,语音助手生成备选通话语音的过程中,调用其他交互引擎,生成备选通话语音还基于其他交互引擎给出的任务执行结果。

将所述通话内容指令作为第三通话语音发送给主叫用户,具体为:当用户通过文字的形式给出通话内容指令时,语音助手按照所述通话内容指令采用语音合成的方式生成第三通话语音,或者语音助手基于通话内容指令生成语义相同或类似的第三通话内容,按照第三通话内容采用语音合成的方式生成第三通话语音。例如,通话内容指令为“没空”时,第三通话内容为“不好意思,我现在没空”。

将所述通话内容指令作为第三通话语音发送给主叫用户,具体为:当用户通过语音的形式给出通话内容指令时,语音助手采用语音合成的方式生成第三通话语音,具体的,语音助手对所述通话内容指令进行语音识别,并按照语音识别结果采用语音合成的方式生成第三通话语音,通过该方式能够屏蔽主叫用户获知被叫用户所处环境中的环境声音,从而保护被叫用户隐私,同时能够确保第三通话语音的清晰度;或者,当用户通过语音的形式给出通话内容指令时,语音助手采用语音合成的方式转述所述通话内容指令生成第三通话语音,具体的,对所述通话内容指令进行语音识别,并基于语音识别结果生成语义相同或类似第三通话内容,按照第三通话内容采用语音合成的方式生成第三通话语音,例如,语音识别结果为“没空”,第三通话内容可以为“不好意思,我现在没空”,通过该方式,能够屏蔽主叫用户获知被叫用户所处环境中的环境声音,从而保护被叫用户隐私,还能够确保第三通话语音的清晰度,此外,使得用户以简短语音参与通话而不会让主叫用户感到冒犯或不礼貌,尤其适用于用户忙碌或不方便长时间语音交流的场景。或者,当用户通过语音的形式给出通话内容指令时,语音助手将所述通话内容指令本身作为第三通话语音。

在辅助通话模式下,语音助手采用何种方式生成第三通话语音,可以由用户事先设置。

在辅助通话模式下,在本次通话过程中且语音助手处于辅助通话模式的持续期间,当用户给出通话内容指令的次数符合第二预设规则时,语音助手所处的通话模式自动从辅助通话模式切换为用户通话模式,此时,语音助手采用第二提示方式向用户提示该通话模式的自动切换,所述第二提示方式可以为声音、震动、语音或文字中的一种或多种。所述第二提示方式与第一提示方式不同,如为不同的声音或不同的震动模式。上述第二预设规则可以为:用户在第二预设时间内给出通话内容指令的次数超过第三预设数量;或;用户连续针对第四预设数量条第二通话语音均给出相应的通话内容指令等。所述第二预设规则与第一预设规则可以相同或不同,即第二预设时间与第一预设时间、第三预设数量与第一预设数量、第四预设数量与第二预设数量中的全部或部分可以相同或不同。

在辅助通话模式下,当符合第三预设规则时,语音助手所处的通话模式自动从辅助通话模式切换为语音助手通话模式,所述第三预设规则为:用户在第三预设时间内未给出通话内容指令;或用户连续针对第五预设数量条第二通话语音均未给出通话内容指令。第三预设时间与第二预设时间、第一预设时间可以相同或不同,第五预设数量与第四预设数量、第二预设数量可以相同或不同。

在另一个实施例中,当移动终端处于静音或震动模式时,不根据第二预设规自动切换语音助手所处的工作模式。

在辅助通话模式下,在接收到用户的模式切换指令后,所述语音助手切换其工作模式为语音助手工作模式或用户通话模式。

(3)用户通话模式

当根据来电接听规则确定来电应当由第一用户来接听时,语音助手自动工作于用户通话模式下,或者,来电被第一用户接通时,语音助手自动工作于用户通话模式下。

在用户通话模式下,在来电被接通后,语音助手为该通话新建一个通话会话进程。在用户通话模式下,语音助手只在接收第一用户的指令并判断其为通话内容指令后,将其作为第三通话语音发送给主叫用户,即在用户通话模式下,语音助手仅仅是在接收到用户的通话内容指令后被动地按照预设的方式将用户的通话内容指令作为第三通话语音对主叫用户进行响应,而不会像其他通话模式下一样主动进行响应,在用户通话模式下,主动响应是由用户来进行。在用户通话模式下,语音助手还接收第二用户的第二通话语音,并将其提供给用户。随着通话主叫和被叫双方的交流,语音助手重复执行上述过程。

此外,在用户通话模式下,当移动终端的通信单元接收到第二用户的第二通话语音时,将所述第二通话语音发送给语音助手,由语音助手提供给用户。所述语音助手基于所述第一用户的通话内容指令和所述第二用户的第二通话语音理解第一用户和第二用户的通话内容和通话进度,以在语音助手切换到其他通话模式时,基于对通话内容和通话进度的理解生成第三通话语音。

在用户通话模式下,在接收到用户的模式切换指令后,所述语音助手切换其工作模式为语音助手工作模式或辅助通话模式。

在用户通话模式下,在接收到一条第二通话语音后,所述语音助手判断是否在第四预设时间内没有接收到通话内容指令,如果是,则语音助手将其通话模式由用户通话模式切换为语音助手通话模式或辅助通话模式,并生成第三通话语音发送给第二用户。当切换为辅助通话模式时,针对该条第二通话语音无需再启动计时器,而是直接将生成的备选通话语音作为第三通话语音发送给第二用户,以避免第二用户等候时间过长。

所述第四预设时间的时长与辅助通话模式中的计时器相同或不同。

在用户通话模式下,当接收到的用户指令为通话内容指令时,语音助手将所述通话内容指令作为第三通话语音发送给主叫用户的具体过程同辅助通话模式。此处不再赘述。

在用户通话模式下,通话内容指令具体为通话内容文本指令或通话内容语音指令。

本发明提供一种语音助手参与通话的方法,参见图3,所述方法包括如下步骤:

语音助手处于用户通话模式下,在第一用户和第二用户的通话过程中,所述语音助手接收第一用户的指令并判断所述指令的类型,当所述指令为通话内容指令时,语音助手将所述通话内容指令作为第三通话语音发送给第二用户;所述语音助手接收第二用户的第二通话语音,并将其提供给第一用户;所述语音助手基于所述第一用户的通话内容指令和所述第二用户的第二通话语音理解通话内容和通话进度;

所述语音助手判断是否需要切换语音助手所处的通话模式,如果是,所述语音助手切换其所处的通话模式,所述语音助手基于对通话内容和通话进度的理解生成第三通话语音发送给第二用户。

优选的,基于所述第一用户的通话内容指令和所述第二用户的第二通话语音理解通话内容和通话进度,具体为:对所述第二用户的第二通话语音进行语音识别,基于所述语音识别结果和所述第一用户的通话内容指令进行语义识别,理解第一用户和第二用户的通话内容和通话进度;或,对所述第一用户的通话内容指令和所述第二用户的第二通话语音进行语音识别,基于所述语音识别结果进行语义识别,理解第一用户和第二用户的通话内容和通话进度。

优选的,所述语音助手处于用户通话模式具体为:所述语音助手检测来电是否被第一用户接通,如果是,语音助手处于用户通话模式;或,所述语音助手处于其他通话模式时判断接收到的第一用户的指令是否为指示切换到用户通话模式的模式切换指令,如果是,基于所述模式切换指令切换到用户通话模式。

优选的,所述语音助手接收第一用户的指令,具体为所述语音助手从移动终端的用户指令采集单元接收指令。

优选的,所述语音助手接收第二用户的第二通话语音,具体为所述语音助手从移动终端的通信单元接收第二用户的第二通话语音。所述移动终端的通信单元通过网络从第二用户接收第二通话语音。

优选的,将所述通话内容指令作为第三通话语音发送给第二用户,具体为,将所述第三通话语音发送给移动终端的通信单元,所述通信单元将所述第三通话语音发送给第二用户。

优选的,当所述接收的第一用户的指令为本地任务指令时,所述本地任务指令不会被语音助手发送给第二用户,语音助手将所述本地任务指令加载到本地会话进程中。

优选的,所述本地任务指令不会被语音助手发送给第二用户,具体为,所述本地任务指令不会被语音助手发送给所述移动终端的通信单元。

优选的,所述语音助手判断是否需要切换通话模式,具体为:所述语音助手判断接收到的第一用户的指令是否为模式切换指令;或者,在接收到一条第二通话语音后,所述语音助手判断是否在第四预设时间内没有接收到通话语音指令。

优选的,所述语音助手判断接收到的第一用户的指令是否为模式切换指令,具体为,判断所述模式切换指令是否是由用户通过移动终端上的按键所生成,和/或,在所述指令为文本指令或语音指令时判断所述文本指令或语音指令的类型是否为模式切换指令。

优选的,所述模式切换指令不会被语音助手发送给第二用户,具体的,所述模式切换指令不会被语音助手发送给通信单元。

优选的,所述语音助手切换通话模式,具体为,所述语音助手将通话模式从用户通话模式切换为语音助手通话模式或辅助通话模式。

优选的,所述理解第一用户和第二用户的通话内容和通话进度,具体为:基于通话语音指令和第二通话语音,填充通话任务对应的槽位。

优选的,所述理解第一用户和第二用户的通话内容和通话进度,具体为:基于语义识别结果,填充通话任务对应的槽位。

优选的,语音助手基于对通话内容和通话进度的理解生成第三通话语音发送给第二用户,具体为,基于所述填充的槽位生成第三通话语音。

以下以一个具体的场景对上述方法进行说明。

假设用户A设置除家人、好友、同事的电话外的其余来电由语音助手代为接听,则在接到其好友B的来电时,移动终端确定该来电应当由用户A接听。当检测到用户接听该来电建立通话时,语音助手为该通话新建一个通话对话进程。用户A与其好友B开始如下通话,在通话过程中,语音助手持续从用户接收通话语音指令和第二语音通话,并对其进行语音识别和语音识别,理解通话内容和通话进度。通话过程如下:

好友B:大学同学C来北京了;

用户A:什么时候来的?

好友B:昨天;

用户A:是出差吗?

好友B:嗯,在北京呆五天左右;

用户A:那我们找个时间聚一下吧;(此后,用户A去参加紧急会议)

好友B:周五晚上你有空吗?

语音助手判断在接收到第二通话语音“周五晚上你有空吗?”之后的五秒内并未接收到用户的通话语音指令,则自动将语音助手的通话模式切换到语音助手通话模式,并根据对通话内容和通话进度的理解,处理该通话:

语音助手:查找用户日程表,确定用户A周五晚上有空,生成第三通话语音“我有空”并将其发送给好友B;

好友B:那就周五晚上吧,我们在新街口见吧,你大概几点能到?

语音助手:查找用户日程表确定用户A六点下班,通过地图交互子引擎查找六点从用户公司所在地出发到新街口需要耗时45分钟,生成第三通话语音“我6点45左右能到”并发送给好友B;

好友B:那到时候见。

语音助手:到时见,再见。

通话结束后,语音助手在用户日程表中增加项目“6点出发,去新街口与好友B、大学同学C聚会”,并将上述通话过程通过语音或文本的形式提供给用户A。

通过上述方法,在通话过程中,处于用户通话模式下的语音助手能够获取第一用户与第二用户的通话内容,理解通话内容和通话进度,并在语音助手切换到语音助手通话模式或辅助通话模式后,能够更加智能地响应第二用户,提高了用户体验。

本发明提供一种参与通话的语音助手,参见图4,所述语音助手包括收发单元、处理单元;所述语音助手处于用户通话模式下;

所述收发单元,用于在第一用户和第二用户的通话过程中,接收第一用户的指令,接收第二用户的第二通话语音,将所述第二通话语音提供给第一用户;还用于响应于所述处理单元的触发,将所述第三通话语音发送给第二用户;

所述处理单元,用于:判断所述第一用户的指令的类型,当所述指令为通话内容指令时,触发所述收发单元将所述通话内容指令作为第三通话语音发送给第二用户;基于所述第一用户的通话内容指令和所述第二用户的第二通话语音理解通话内容和通话进度;

所述处理单元,还用于判断是否需要切换语音助手所处的通话模式,如果是,切换所述语音助手所处的通话模式,基于对通话内容和通话进度的理解生成第三通话语音,触发所述收发单元将所述第三通话语音发送给第二用户。

优选的,所述语音助手用于所述移动终端。

优选的,所述处理单元基于所述第一用户的通话内容指令和所述第二用户的第二通话语音理解通话内容和通话进度,具体为:对所述第二用户的通话语音进行语音识别,基于所述语音识别结果和所述第一用户的通话内容指令进行语义识别,理解第一用户和第二用户的通话内容和通话进度;或,对所述第一用户的通话内容指令和所述第二用户的第二通话语音进行语音识别,基于所述语音识别结果进行语义识别,理解第一用户和第二用户的通话内容和通话进度。

优选的,所述语音助手处于用户通话模式具体为:所述处理单元检测来电是否被第一用户接通,如果是,控制所述语音助手处于用户通话模式;或,所述处理单元在所述语音助手处于其他通话模式时判断接收到的第一用户的指令是否为指示切换到用户通话模式的模式切换指令,如果是,基于所述模式切换指令切换到用户通话模式。

优选的,接收第一用户的指令,具体为所述收发单元从移动终端的用户指令采集单元接收指令。

优选的,接收第二用户的第二通话语音,具体为从移动终端的通信单元接收第二用户的第二通话语音。所述移动终端的通信单元通过网络从第二用户接收第二通话语音。

优选的,所述处理单元触发所述收发单元将所述通话内容指令作为第三通话语音发送给第二用户,具体为,所述处理单元触发所述收发单元将所述第三通话语音发送给移动终端的通信单元,所述通信单元将所述第三通话语音发送给第二用户。

优选的,所述处理单元在判断所述第一用户的指令为本地任务指令时,所述处理单元将所述本地任务指令加载到本地会话进程中,而不需要触发收发单元,。

优选的,所述本地任务指令不会被收发单元发送给所述移动终端的通信单元。

优选的,所述处理单元判断是否需要切换通话模式,具体为:判断所述收发单元接收到的第一用户的指令是否为模式切换指令;或者,在所述收发单元接收到一条第二通话语音后,判断所述收发单元是否在第四预设时间内没有接收到通话内容指令。

优选的,所述判断接收到的第一用户的指令是否为模式切换指令,具体为,判断所述模式切换指令是否是由用户通过移动终端上的按键所生成,和/或,在所述指令为文本指令或语音指令时判断所述文本指令或语音指令的类型是否为模式切换指令。

优选的,所述处理单元在判断所述第一用户的指令为所述模式切换指令时,不触发所述收发单元,即所述模式切换指令不会被所述收发单元经由移动终端的通信单元发送给第二用户。

优选的,所述切换所述语音助手所处的通话模式,具体为,将所述语音助手的通话模式从用户通话模式切换为语音助手通话模式或辅助通话模式。

优选的,所述理解第一用户和第二用户的通话内容和通话进度,具体为:基于通话语音指令和第二通话语音,填充通话任务对应的槽位。

优选的,所述理解第一用户和第二用户的通话内容和通话进度,具体为:基于语义识别结果,填充通话任务对应的槽位。

优选的,基于对通话内容和通话进度的理解生成第三通话语音发送给第二用户,具体为,基于所述填充的槽位生成第三通话语音。

本发明还提供一种语音助手参与通话的方法,参见图5,所述语音助手处于语音助手通话模式下,所述方法包括如下步骤:

步骤1,在通话过程中,语音助手接收主叫用户的第二通话语音,生成第三通话语音发送给主叫用户,以响应所述主叫用户的第二通话语音;

步骤2,语音助手接收第一用户的指令并判断其为通话内容指令时,确定用户插入该指令的意图,改变生成第三通话语音的逻辑;所述语音助手接收主叫用户的下一轮第二通话语音,并基于改变后的逻辑生成第三通话语音;

步骤3,所述语音助手判断用户给出通话内容指令的次数是否满足第一预设规则,如果是,将语音助手的通话模式由语音助手通话模式切换到辅助通话模式;

步骤4,在辅助通话模式下,在接收到主叫用户的下一轮第二通话语音时,启动计时器,并生成备选通话语音,若在计时器到期之前,接收到第一用户的指令并判断其为通话内容指令时,则将所述通话内容指令作为第三通话语音发送给主叫用户,否则,将所述备选通话语音作为第三通话语音发送给主叫用户。

优选的,所述语音助手处于语音助手通话模式下,具体为:当根据来电接听规则确定来电应当由语音助手来接听时,语音助手接通所述来电,并自动工作于语音助手通话模式下。

优选的,步骤2中,所述语音助手在接收到第一用户的指令后,判断所述指令是否包括本地任务指令标识词,若不包括,则确定所述用户指令是通话内容指令。

优选的,步骤2中,所述语音助手在接收到第一用户的指令后,判断所述指令是否包括本地任务指令标识词或模式切换标识词,若均不包括,则确定所述用户指令是通话内容指令。

优选的,所述第一预设规则为:用户在第一预设时间内给出通话内容指令的次数超过第一预设数量;或;用户连续针对第二预设数量条第二通话语音均给出相应的通话内容指令。

优选的,用户给出通话内容指令的时机为接收到一条第二通话语音,但语音助手尚未针对该条第二通话语音进行响应,或语音助手针对上一条第二通话语音进行了响应但尚未收到下一条第二通话语音之前。

优选的,所述语音助手判断用户给出通话内容指令的次数不满足第一预设规则时,语音助手不改变其工作模式,继续执行步骤1和/或2。

优选的,在辅助通话模式下,当用户给出通话内容指令的次数符合第二预设规则时,语音助手所处的通话模式自动从辅助通话模式切换为用户通话模式。

优选的,在辅助通话模式下,当符合第三预设规则时,语音助手所处的通话模式自动从辅助通话模式切换为语音助手通话模式,所述第三预设规则为:用户在第三预设时间内未给出通话内容指令;或用户连续针对第五预设数量条第二通话语音均未给出通话内容指令。

通过上述方法,语音助手能够在不同通话模式之间自动切换,以不同的通话模式参与通话,提升了用户的通话体验。

本发明还提供一种参与通话的语音助手,如前文所述和图4所示的,所述语音助手包括收发单元和处理单元,上述两个单元除了前文所述的功能外,在所述语音助手处于语音助手通话模式下时,还具有如下功能:

所述收发单元,还用于接收主叫用户的第二通话语音,还用于响应于所述处理单元的触发将所述第三通话语音发送给主叫用户;

所述处理单元,还用于生成第三通话语音,并触发所述收发单元将所述第三通话语音发送给主叫用户,以响应所述主叫用户的第二通话语音;

所述收发单元,还用于接收第一用户的指令;

所述处理单元,还用于判断所述指令为通话内容指令时,确定用户插入该指令的意图,改变生成第三通话语音的逻辑;

所述收发单元,还用于接收主叫用户的下一轮第二通话语音;

所述处理单元,还用于基于改变后的逻辑生成第三通话语音,并触发所述收发单元将所述第三通话语音发送给主叫用户,以响应所述下一轮第二通话语音;还用于判断用户给出通话内容指令的次数是否满足第一预设规则,如果是,将语音助手的通话模式由语音助手通话模式切换到辅助通话模式;

在所述语音助手处于辅助通话模式下时,所述收发单元还用于接收主叫用户的下一轮第二通话语音;所述处理单元还用于启动计时器,并生成备选通话语音,若在计时器到期之前从收发单元接收到第一用户的指令并判断其为通话内容指令时,则将所述通话内容指令作为第三通话语音,触发所述收发单元将所述第三通话语音发送给主叫用户,否则,将所述备选通话语音作为第三通话语音,并触发所述收发单元将所述第三通话语音发送给主叫用户。

优选的,所述语音助手处于语音助手通话模式下,具体为:处理单元根据来电接听规则确定来电应当由语音助手来接听,接通所述来电,并控制所述语音助手工作于语音助手通话模式下。

优选的,判断接收到的第一用户的指令是否包括本地任务指令标识词,若不包括,则确定所述用户指令是通话内容指令。

优选的,判断接收到的第一用户的指令是否包括本地任务指令标识词或模式切换标识词,若均不包括,则确定所述用户指令是通话内容指令。

所述第一预设规则为:用户在第一预设时间内给出通话内容指令的次数超过第一预设数量;或;用户连续针对第二预设数量条第二通话语音均给出相应的通话内容指令。

优选的,所述收发单元接收第一用户的指令的时机为接收到一条第二通话语音,但处理单元尚未针对该条第二通话语音进行响应,或处理单元针对上一条第二通话语音进行了响应但尚未收到下一条第二通话语音之前。

所述语音助手判断用户给出通话内容指令的次数不满足第一预设规则时,语音助手不改变其工作模式,收发单元和处理单元继续执行其在语音助手通话模式下的功能。

优选的,在辅助通话模式下,当用户给出通话内容指令的次数符合第二预设规则时,所述处理单元将语音助手所处的通话模式从辅助通话模式切换为用户通话模式。

优选的,在辅助通话模式下,当符合第三预设规则时,所述处理单元将语音助手所处的通话模式从辅助通话模式切换为语音助手通话模式,所述第三预设规则为:用户在第三预设时间内未给出通话内容指令;或用户连续针对第五预设数量条第二通话语音均未给出通话内容指令。

本发明还提供一种语音助手识别并执行被叫用户指令的方法,参见图6,所述方法包括如下步骤:

步骤1,当来电被接通、与主叫用户建立通话后,所述语音助手为所述通话新建通话会话进程;

步骤2,在第一用户和/或语音助手与主叫用户进行通话的过程中,所述语音助手从所述第一用户接收用户指令;

步骤3,所述语音助手判断所述用户指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令,其不属于所述通话会话进程,将所述任务指令加载到所述语音助手的本地会话进程中;否则,确定所述用户指令是通话内容指令,所述语音助手基于所述通话内容指令生成第三通话语音,发送给所述主叫用户,或将所述通话内容指令作为第三通话语音发送给所述主叫用户。

优选的,所述用户指令为语音指令或文本指令。

优选的,将所述任务指令加载到所述语音助手的本地会话进程中,具体为:当用户与语音助手之间存在与所述任务指令相关联的本地会话进程时,将所述任务指令加载到所述本地会话进程中进行处理,当用户与语音助手之间不存在与所述任务指令相关联的本地会话进程时,新建一个本地会话进程,并加载所述任务指令。

优选的,当所述语音助手处于语音助手通话模式时,基于所述通话内容指令生成第三通话语音。

优选的,所述基于通话内容指令生成第三通话语音,具体为:对该通话内容指令进行语义识别,确定用户插入该通话内容指令的意图,基于所述意图改变生成第三通话语音的逻辑,基于改变后的逻辑生成第三语音通话。

优选的,当所述语音助手处于辅助通话模式或用户通话模式时,将所述通话内容指令作为第三通话语音发送给所述主叫用户。具体的将通话内容指令作为第三通话语音发送给主叫用户的过程,参见前文在介绍辅助通话模式或用户通话模式时的记载,此处不再赘述。

优选的,所述本地任务指令标识词为所述语音助手的唤醒词。

优选的,所述本地任务指令标识词为用户自定义的任意词语。

优选的,在步骤3中,所述语音助手判断所述用户指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令,否则,进一步判断所述用户指令是否包括模式切换标识词,如果是,确定所述用户指令为模式切换指令,基于所述模式切换指令完成语音助手模式的切换,否则,确定所述用户指令是通话内容指令。

优选的,所述方法还包括判断是否需要自动切换语音助手所处的通话模式,如果是,切换语音助手所处的通话模式。具体的自动切换条件,如前文所述。此处不再赘述。

通过上述方法,在用户与主叫用户通话或者语音助手与主叫用户通话的过程中,用户可以随时与语音助手进行对话,以使得语音助手完成不同于通话任务的其他任务,提升了用户体验。

本发明还提供一种识别并执行被叫用户指令的语音助手,如前文所述和图4所示的,所述语音助手包括收发单元和处理单元,上述两个单元除了前文所述的功能外,还具有如下功能:

所述处理单元,还用于:当来电被接通、与主叫用户建立通话后,为所述通话新建通话会话进程;

所述收发单元,还用于:在第一用户和/或语音助手与主叫用户进行通话的过程中,从所述第一用户接收用户指令;还用于响应于所述处理单元的触发,将所述第三通话语音发送给第二用户;

所述处理单元,还用于:判断所述用户指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令,其不属于所述通话会话进程,将所述任务指令加载到所述语音助手的本地会话进程中;否则,确定所述用户指令是通话内容指令,基于所述通话内容指令生成第三通话语音,触发所述收发单元将所述第三通话语音发送给所述主叫用户,或将所述通话内容指令作为第三通话语音,触发所述收发单元将所述第三通话语音发送给所述主叫用户。

优选的,所述用户指令为语音指令或文本指令。

优选的,将所述任务指令加载到所述语音助手的本地会话进程中,具体为:当用户与语音助手之间存在与所述任务指令相关联的本地会话进程时,将所述任务指令加载到所述本地会话进程中进行处理,当用户与语音助手之间不存在与所述任务指令相关联的本地会话进程时,新建一个本地会话进程,并加载所述任务指令。

优选的,当所述语音助手处于语音助手通话模式时,所述处理单元基于所述通话内容指令生成第三通话语音。

优选的,所述基于通话内容指令生成第三通话语音,具体为:对该通话内容指令进行语义识别,确定用户插入该通话内容指令的意图,基于所述意图改变生成第三通话语音的逻辑,基于改变后的逻辑生成第三语音通话。

优选的,当所述语音助手处于辅助通话模式或用户通话模式时,将所述通话内容指令作为第三通话语音发送给所述主叫用户。

优选的,所述本地任务指令标识词为所述语音助手的唤醒词。

优选的,所述本地任务指令标识词为用户自定义的任意词语。

优选的,所述处理单元还用于判断所述用户指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令,否则,进一步判断所述用户指令是否包括模式切换标识词,如果是,确定所述用户指令为模式切换指令,基于所述模式切换指令完成语音助手模式的切换,否则,确定所述用户指令是通话内容指令。

优选的,所述处理单元还用于:判断是否需要自动切换语音助手所处的通话模式,如果是,切换语音助手所处的通话模式。具体的自动切换条件,如前文所述。此处不再赘述。

本发明还提供一种语音助手执行本地任务的方法,参见图7,所述方法包括如下步骤:

步骤1,当所述语音助手处于用户通话模式时,所述语音助手接收第一用户的语音指令并确定所述语音指令为通话内容指令时,语音助手将所述通话内容指令作为第三通话语音发送给第二用户;所述语音助手接收第二用户的第二通话语音,并将其提供给第一用户;

步骤2,所述语音助手再次接收第一用户的语音指令并判断其为本地任务指令;

步骤3,所述语音助手执行所述本地任务指令,将第一执行结果通知给用户;

步骤4,所述语音助手继续接收下一轮的第一用户的语音指令,并确定该语音指令为通话内容指令,接收下一轮的第二用户的第二通话语音;

步骤5,判断所述步骤4中接收的通话内容指令和/或第二通话语音是否包括所述执行过的本地任务指令的更新信息,如果是,执行步骤6;

步骤6,根据所述更新信息替换所述执行过的本地任务指令中的全部或部分信息,生成第二本地任务指令,执行所述第二本地任务指令,将第二执行结果通知给用户。

优选的,所述语音助手将步骤4中的通话内容指令和第二通话语音分别提供给第二用户和第二用户。

优选的,语音助手接收到所述通话语音指令和第二通话语音后,基于所述通话内容指令和所述第二用户的第二通话语音理解通话内容和通话进度。

优选的,步骤5具体为:所述语音助手判断步骤3中执行过的所述本地任务指令是否与所述通话内容指令和/或第二通话语音有关,如果是,判断所述步骤4中接收的通话内容指令和/或第二通话语音是否包括所述执行过的本地任务指令的更新信息,如果是,执行步骤6;

优选的,判断所述再次接收的语音指令的类型是否为本地任务指令,具体为,判断所述语音指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令。

优选的,所述本地任务指令标识词为所述语音助手的唤醒词。

优选的,所述本地任务指令标识词为用户自定义的任意词语。

优选的,所述下一轮的第一用户的语音指令为用户基于所述第一执行结果所生成的。

优选的,所述方法还包括:判断是否需要切换语音助手所处的通话模式,如果是,所述语音助手切换通话模式为语音助手通话模式或辅助通话模式,所述语音助手基于对通话内容和通话进度的理解生成第三通话语音发送给第二用户。

优选的,所述方法还包括,在语音助手通话模式或辅助通话模式,判断是否需要切换语音助手所处的通话模式,如果是,切换所述语音助手的通话模式。具体的切换过程如前文所述,此处不再赘述。

以下结合具体场景对上述方法进行描述,

假设用户A设置除家人、好友、同事的电话外的其余来电由语音助手代为接听,则在接到其好友B的来电时,移动终端确定该来电应当由用户A接听。当检测到用户接听该来电建立通话时,语音助手为该通话新建一个通话对话进程。用户A与其好友B开始如下通话,在通话过程中,语音助手持续从用户接收通话语音指令和第二通话语音,并对其进行语音识别和语义识别,理解通话内容和通话进度。通话过程如下:

好友B:大学同学C来北京了;

用户A:什么时候来的?

好友B:昨天;

用户A:是出差吗?

好友B:嗯,在北京呆五天左右;

用户A:那我们找个时间聚一下吧;

好友B:周五晚上你有空吗?

用户A:静音,我周五晚上有日程吗?

语音助手通过用户指令中的“静音”判断该指令为本地任务指令,于是查找用户日程表,并向用户A提供“周五晚上已有日程安排”的任务执行结果。

用户A:不巧啊,我周五晚上没空啊;

好友B:那周六中午呢?

此时,语音助手判断好友B的第二通话语音中包括了第一本地任务指令的更新信息,此时,语音助手根据所述更新信息替换所述第一本地任务指令中“周五晚上”,生成第二本地任务指令“静音,我周五晚上有日程吗?”,所述语音助手执行所述第二本地任务指令,将第二执行结果通知给用户,在本场景中,第二执行结果为“周六中午没有日程”。

用户A基于上述第二执行结果答复好友B“周六中午没问题”。

通过上述方法,根据用户与主叫的语音通话内容自动更新本地任务指令,能够减少用户答复主叫用户的时延,提升用户体验。

本发明还提供一种执行本地任务的语音助手,所述语音助手处于用户通话模式,如前文所述和图4所示的,所述语音助手包括收发单元和处理单元,上述两个单元除了前文所述的功能外,还具有如下功能:

收发单元,还用于接收第一用户的语音指令,接收第二用户的第二通话语音并将其提供给用户,响应于所述处理单元的触发,将所述第三通话语音发送给第二用户;

所述处理单元,还用于判断所述语音指令为通话内容指令时,将所述通话内容指令作为第三通话语音,触发所述收发单元将所述第三通话语音发送给第二用户;

所述收发单元,还用于再次接收的第一用户的语音指令;

所述处理单元,还用于判断所述再次接收的语音指令是否为本地任务指令,如果是,则执行所述本地任务指令,触发所述收发单元将第一执行结果通知给用户;

所述收发单元,还用于响应于所述处理单元的触发,将第一执行结果通知给用户;

收发单元,还用于接收下一轮的第一用户的语音指令,接收下一轮的第二用户的第二通话语音;

所述处理单元,还用于确定所述下一轮的第一用户的语音指令为通话内容指令,判断所述通话内容指令和/或所述下一轮的第二用户的第二通话语音是否包括上述执行过的本地任务指令的更新信息,如果是,根据所述更新信息替换所述执行过的本地任务指令中的全部或部分信息,生成第二本地任务指令,执行所述第二本地任务指令,触发所述收发单元将第二执行结果通知给用户;

所述收发单元,还用于响应于所述处理单元的触发,将第二执行结果通知给用户。

优选的,所述收发单元将接收到的下一轮的第一用户的语音指令发送给第二用户,所述收发单元将接收到的下一轮的第二用户的第二通话语音提供给第一用户。

优选的,所述处理单元还基于所述通话内容指令和所述第二通话语音理解通话内容和通话进度。

优选的,所述处理单元还判断所述执行过的本地任务指令是否与所述通话内容指令和/或第二通话语音有关,如果是,所述处理单元判断所述通话内容指令和/或所述下一轮的第二用户的第二通话语音是否包括上述执行过的本地任务指令的更新信息。

优选的,判断所述再次接收的语音指令的类型是否为本地任务指令,具体为,判断所述语音指令是否包括本地任务指令标识词,如果是,确定所述用户指令为本地任务指令。

优选的,所述本地任务指令标识词为所述语音助手的唤醒词。

优选的,所述本地任务指令标识词为用户自定义的任意词语,如“静音”。

优选的,所述下一轮的第一用户的语音指令为用户基于所述第一执行结果所生成的。

所述处理单元,还用于判断是否需要切换语音助手所处的通话模式,如果是,将所述语音助手的通话模式切换为语音助手通话模式或辅助通话模式,基于对通话内容和通话进度的理解生成第三通话语音发送给第二用户。

所述处理单元,还用于在语音助手通话模式或辅助通话模式下,判断是否需要切换语音助手所处的通话模式,如果是,切换所述语音助手的通话模式。

本发明中的所有方法/装置均涉及语音助手的工作模式,其互相之间可以任意的组合。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦式可编程只读存储器(EPROM)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。

以上说明只是为了方便理解本发明而举出的例子,不用于限定本发明的范围。在具体实现时,本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少,在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。

尽管已经示出和描述了本发明的实施例,本领域技术人员应当理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同替换所限定,在未经创造性劳动所作的改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号