首页> 中国专利> 一种人机对话中教授意图答案生成方法

一种人机对话中教授意图答案生成方法

摘要

本发明公开了一种人机对话中教授意图答案生成方法,所述方法包括:对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图则进入下一步骤;在所述历史记录中寻找当前对话对应的问句;结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;对于相关答案集合进行过滤;基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果及当前对话的回答返回。本发明能够对人机对话中教授意图下对用户的教授内容进行良好的反馈,提高人机对话的满意度。

著录项

  • 公开/公告号CN106095950A

    专利类型发明专利

  • 公开/公告日2016-11-09

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN201610422829.X

  • 申请日2016-06-14

  • 分类号G06F17/30(20060101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人钟文芳

  • 地址 100190 北京市海淀区中关村东路95号

  • 入库时间 2023-06-19 00:49:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-07

    授权

    授权

  • 2019-05-31

    专利申请权的转移 IPC(主分类):G06F16/33 登记生效日:20190510 变更前: 变更后: 申请日:20160614

    专利申请权、专利权的转移

  • 2016-12-07

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160614

    实质审查的生效

  • 2016-11-09

    公开

    公开

说明书

技术领域

本发明涉及人机对话技术领域,具体来说涉及一种人机对话中的教授意图答案生成方法。

背景技术

人机对话作为人工智能领域一个重要的研究课题,在对话过程中,用户的体验度十分重要。随着语音识别技术的发展,人机对话在聊天机器人、语音助手、虚拟人场景对话、儿童陪聊机器人等各个领域均具有重要作用。然而,在人机对话过程中,对于一些问题,机器人的回答并不正确,或者用户对机器人返回的答案持有不同的意见,此时,用户往往会表达自己的意见,来纠正或者教授机器人,这种情况下,用户更希望的是机器人能够针对他的观点进行回答,但目前的人机对话系统往往是直接返回知识库的答案或者给以模棱两可的回复,虽然这样的回复可以减少计算机的正面回答及回答的错误率,但带给用户的感觉是计算机并没有领会用户交流或者教授的意图,这样的对话体验并不友好。

发明内容

为解决上述的一个或多个问题,本发明提供了一种人机对话中教授意图答案生成方法,本发明能够对人机对话教授意图下对用户的教授内容进行良好的反馈,从而提高人机对话的满意度。

本发明提供的一种人机对话中教授意图答案生成方法包括以下步骤:

步骤1,对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;

步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图,则进入步骤3进行自我对话;

步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对应的问句;

步骤4,根据所述步骤3找到的问句,结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;

步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案;

步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果,并作为当前对话的回答进行返回。

可选地,所述步骤1进一步包括以下步骤:

步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列,所述词向量序列由每个句子分词后得到的词向量组成;

步骤12,基于每个句子的词向量序列,计算句间相似度;

步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别,获得当前对话的对话意图。

可选地,所述步骤12中,采用如下公式计算句间相似度:

>S(x,y)=x·y||x||·||y||>

其中,S(x,y)表示句间相似度,x,y分别表示句子x和句子y的词向量序列。

可选地,所述对话意图至少包括闲聊意图和教授意图,其中,所述教授意图是指用户对计算机返回答案的纠正,或者用户对计算机答案表达自己的观点。

可选地,所述询问意图值是指用户对话是问句的概率。

可选地,所述步骤3中,采用下式在历史记录中寻找当前对话对应的问句:

>ρi=α·1D(xi,xt)+β·S(xi,xt)+γAsk(xi),0<ilen>

其中,ρi表示第i条历史对话是当前对话语句对应问句的概率值,D(xi,xt)表示第i条历史对话与当前对话之间的距离,xt表示当前对话,xi表示第i条历史对话,Ask(xi)表示第i条历史对话询问意图值的大小,len表示对话历史记录的长度,α,β,γ分别表示权重;S(xi,xt)表示第i条历史对话与当前对话之间的句间相似度。

可选地,所述步骤4中,采用下式来进行多轮自我对话以获取相关答案集合:

ai+1=F(q,ai),0≤i≤n

其中,q表示步骤3找到的当前对话对应的问句,ai表示第i轮自我对话得到的答案,a0表示当前对话,F(q,ai)表示通过问句q和当前答案ai,得到的自我对话下一轮的答案,n为对话的最多轮数。

可选地,所述步骤5中,采用下式来迭代计算每条答案的权重:

>W(vj)=(1-d)+d*ΣVjIn(vi)S(i,j)ΣVkOut(Vj)S(j,k)W(vj)>

其中,W(vj)表示第i条答案的权重,Vj表示第j条答案,vi表示第i条答案,Vk表示第k条答案,In(vi)是指存在指向第i条答案信息的句子集合,Out(vj)是第j条答案所指向的句子集合,S(i,j)及S(j,k)表示两个句子的相似程度。

可选地,所述步骤5中,当摘要抽取得到的信息数量较多时,采用句间词向量的相似度对得到的信息进行聚类,将相似度较高的一类信息作为摘要抽取的内容。

从上述技术方案可以看出,本发明在人机对话教授意图下具有以下有益效果:

(1)本发明能够自动判断用户对话的教授意图,针对用户教授内容,进行自我对话,生成与用户对话更加相关的答案;

(2)本发明针对人机对话中的教授意图,通过自我对话生成的答案具有更好的用户体验度。

附图说明

图1是根据本发明一实施例的人机对话中教授意图答案生成方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

本发明针对人机对话中的教授意图,采用词向量模型对于用户对话语句进行意图识别,获得用户对话的询问意图;明确用户教授意图情况下,首先从对话历史中选出当前对话语句对应的问题;根据匹配到的问题,结合用户教授答案及互联网相关信息模拟多轮自我对话,然后对自我对话获取的多轮信息进行过滤和摘要抽取;最终将抽取得到的摘要作为计算机对用户教授意图的反馈。

在本发明的一个示例性实施例中,提供了一种人机对话中基于自我对话的用户教授意图答案生成方法。图1为根据本发明一实施例的人机对话中基于自我对话的用户教授意图答案生成方法的流程图。如图1所示,所述方法包括以下步骤:

步骤1,对于收到的用户的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;

所述步骤1进一步包括以下步骤:

步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列,所述词向量序列由每个句子分词后得到的词向量组成;

步骤12,基于每个句子的词向量序列,采用如下公式计算句间相似度:

>S(x,y)=x·y||x||·||y||---(5)>

其中,S(x,y)表示句间相似度,x,y分别表示句子x和句子y的词向量序列,其由句子x,y分词后得到的词向量组成。

步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别,获得当前对话的对话意图。

步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案,无需进行自我对话步骤;如果当前对话的意图是教授意图,则进入步骤3,进行自我对话,生成最佳答案返回;

其中,教授意图是指用户对计算机返回答案的纠正,或者用户对计算机答案表达自己的观点;询问意图值是指用户对话是问句的概率。

步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对应的问句;

在本发明一实施例中,采用下式在历史记录中寻找当前对话对应的问句:

>ρi=α·1D(xi,xt)+β·S(xi,xt)+γAsk(xi)(0<ilen)---(6)>

其中,ρi表示第i条历史对话是当前对话语句对应问句的概率值,D(xi,xt)表示第i条历史对话与当前对话之间的距离,xt表示当前对话,xi表示第i条历史对话,Ask(xi)表示第i条历史对话询问意图值的大小,len表示对话历史记录的长度,len<=10,当前对话为第0条,当前对话的前一句历史对话为第1条历史,以此类推;α,β,γ分别表示权重;S(xi,xt)表示第i条历史对话与当前对话之间的句间相似度,其计算方法如公式(5)所示。

步骤4,根据所述步骤3找到的问句,结合当前对话及相关网络信息,进行多轮模拟自我对话获取相关答案集合;

在本发明一实施例中,采用下式来进行多轮自我对话以获取相关答案集合:

ai+1=F(q,ai)0≤i≤n>

其中,q表示步骤3找到的当前对话对应的问句,ai表示第i轮自我对话得到的答案,a0表示当前对话,F(q,ai)表示通过问句q和当前答案ai,得到的自我对话下一轮的答案,n为对话的最多轮数,由此可以得到与当前对话相关的答案集合为{a0,a1,......an}。

步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案;

其中,所述过滤可采用多种过滤方法,只要是能够过滤掉冗余信息和不相关信息的方法都可以使用,本发明对其不作具体限定。

步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果,并作为当前对话的回答进行返回。

在本发明一实施例中,采用下式来计算每条答案的权重:

>W(vj)=(1-d)+d*ΣVjIn(vi)S(i,j)ΣVkOut(Vj)S(j,k)W(vj)---(8)>

其中,W(vj)表示第i条答案的权重,Vj表示第j条答案,vi表示第i条答案,Vk表示第k条答案,In(vi)是指存在指向第i条答案信息的句子集合,在本方法中,默认除了第i条答案vi的其他答案集合为In(vi),Out(vj)是第j条答案所指向的句子(这里的句子指的是答案集合中的答案)集合,在本方法中,默认除了第j条答案vj的其他答案集合为Out(vj),求和的分子S(i,j)及分母S(j,k)表示两个句子的相似程度,其计算方法如公式(5)所示,d是阻尼系数。

公式(8)是一个迭代的过程,通过多次的迭代计算,所有句子的权值会收敛到一个稳定的值,最后获取权值最高的答案,即最重要的答案。

在本发明一实施例中,当摘要抽取得到的信息数量较多时,可采用句间词向量的相似度对得到的信息进行聚类,将相似度较高的一类信息作为摘要抽取的结果,其中,句间词向量的相似度计算如公式(1)所示。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号