首页> 中国专利> 基于人工智能的历史问题召回方法、装置及相关设备

基于人工智能的历史问题召回方法、装置及相关设备

摘要

本发明公开了一种基于人工智能的历史问题召回方法,应用于人工智能技术领域,用于解决历史问题召回的过程中对于简问问题无法进行召回,导致历史问题召回率低、召回效果不完善的技术问题。本发明提供的方法包括:获取同一会话中包含有简问问题和完整问题的历史问题;将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题;通过预先训练好的问题对该简问问题和完整问题分别进行处理,得到第一文本特征和第二文本特征;将该第一文本特征和第二文本特征分别输入训练好的问题对比模型的分类层,得到对应组中的简问问题和完整问题是否为相似问题的预测结果;当该简问问题和完整问题为相似问题时,将该简问问题和该完整问题同时进行召回。

著录项

  • 公开/公告号CN113688246B

    专利类型发明专利

  • 公开/公告日2023.09.26

    原文格式PDF

  • 申请/专利权人 中国平安人寿保险股份有限公司;

    申请/专利号CN202111016985.3

  • 发明设计人 黄玉胜;刘丹;

    申请日2021.08.31

  • 分类号G06F16/35(2019.01);G06F40/289(2020.01);G06F16/33(2019.01);G06F18/22(2023.01);

  • 代理机构深圳国新南方知识产权代理有限公司 44374;

  • 代理人代文成

  • 地址 518000 广东省深圳市福田区益田路5033号平安金融中心14、15、16、37、41、44、45、46层

  • 入库时间 2023-11-03 19:47:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-26

    授权

    发明专利权授予

说明书

技术领域

本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的历史问题召回方法、装置、计算机设备及存储介质。

背景技术

为了降低成本且能及时解答用户的疑问,智能问答系统应运而生,智能问答系统旨在要求机器理解自然语言组成的问题,并给出合理准确的答案,智能问答系统是目前学术界和工业界的研究热点。

在目前的智能问答系统中,为了提高智能问答系统的用户体验及便捷性,当用户在进入该问答系统之后、提问之前,会根据用户的历史信息、历史场景等信息进行问题推荐,将用户有可能询问的问题显示出来,便于用户直接点击相应的问题进行提问,以免让用户再次输入相关的问题,以提升整个问答系统的用户体验。

问题召回即为该场景下我们需要研究的课题,问题召回是从海量的候选问中召回最有可能被用户关注和点击的问题,是问题推荐最关键的一步,传统的召回方法一般是将用户输入的历史问题直接显示出来以实现问题召回,当用户在文本框中输入了相关问题时,现有方法无非是通过语义召回或者通过关键词召回,在问题召回的过程中无法结合历史问题所在的上下文将用户简问的相似问题一同进行召回,这大大影响了问题召回的效果。

发明内容

本发明实施例提供一种基于人工智能的历史问题召回方法、装置、计算机设备及存储介质,以解决历史问题召回的过程中对于简问问题无法进行召回,导致历史问题召回率低、召回效果不完善的技术问题。

一种基于人工智能的历史问题召回方法,该方法包括:

获取同一会话中包含有简问问题和完整问题的历史问题;

将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题;

通过预先训练好的问题对比模型的第一编码层和第二编码层分别对组合后的每组该历史问题中的简问问题和完整问题分别进行编码,得到第一编码特征和第二编码特征;

通过预先训练好的问题对比模型的第一全连接层将该第一编码特征转换为第一文本特征,通过预先训练好的问题对比模型的第二全连接层将该第二编码特征转换为第二文本特征;

将该第一文本特征和该第二文本特征分别输入该预先训练好的问题对比模型的分类层,得到对应组中的简问问题和完整问题是否为相似问题的预测结果;

当该预测结果表示对应组中的简问问题和完整问题为相似问题时,将该简问问题和该完整问题同时进行召回。

一种基于人工智能的历史问题召回装置,该装置包括:

问题获取模块,用于获取同一会话中包含有简问问题和完整问题的历史问题;

组合模块,用于将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题;

编码模块,用于通过预先训练好的问题对比模型的第一编码层和第二编码层分别对组合后的每组该历史问题中的简问问题和完整问题分别进行编码,得到第一编码特征和第二编码特征;

转换模块,用于通过预先训练好的问题对比模型的第一全连接层将该第一编码特征转换为第一文本特征,通过预先训练好的问题对比模型的第二全连接层将该第二编码特征转换为第二文本特征;

预测模块,用于将该第一文本特征和该第二文本特征分别输入该预先训练好的问题对比模型的分类层,得到对应组中的简问问题和完整问题是否为相似问题的预测结果;

召回模块,用于当该预测结果表示对应组中的简问问题和完整问题为相似问题时,将该简问问题和该完整问题同时进行召回。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的历史问题召回方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人工智能的历史问题召回方法的步骤。

本发明提出的基于人工智能的历史问题召回方法、装置、计算机设备及存储介质,通过获取同一会话中包含有简问问题和完整问题的历史问题,并将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题,然后通过预先训练好的问题对比模型分析每组历史问题中的简问问题和完整问题是否存在相似问的情况,当存在时,将该简问问题和对应的完整问题同时进行召回,一般属于同一会话中的历史问题存在相似问的可能性较大,本发明在对历史问题进行召回的过程中通过预先训练好的问题对比模型结合了同一会话中的历史问题所在的上下文,能够将用户简问地与完整问题相似的问题一同进行召回,提高基于人工智能的历史问题召回率,使得历史问题召回的效果更好。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中基于人工智能的历史问题召回方法的一应用环境示意图;

图2是本发明一实施例中基于人工智能的历史问题召回方法的一流程图;

图3是本发明另一实施例中基于人工智能的历史问题召回方法的一流程图;

图4是本发明一实施例中问题对比模型的网络结构示意图;

图5是本发明一实施例中基于人工智能的历史问题召回装置的结构示意图;

图6是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请提供的基于人工智能的历史问题召回方法,可应用在如图1的应用环境中,其中,该计算机设备可以通过网络与服务器进行通信。其中,该计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

其中,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

在用户进入智能问答系统之后、提问之前的场景中,为了解决历史问题召回的过程中无法结合历史问题所在的上下文将用户简问的相似问题一同进行召回,导致历史问题召回效果差的技术问题,如图2所示,本实施例提供一种基于人工智能的历史问题召回方法,以该方法应用在图1中的计算机设备为例进行说明,该方法包括如下步骤S101至S106。

S101、获取同一会话中包含有简问问题和完整问题的历史问题。

其中,可以将同一用户ID在预设时间间隔之间提出的历史问题确定为同一会话中的历史问题,该预设的时间间隔例如为5分钟。可以理解的是,本实施例并不限于获取一个同一会话中的历史问题,也可以根据业务需要获取多个会话中包含有简问问题和完整问题的历史问题,例如,获取近预设时间段内一个或多个同一会话中包含有简问问题和完整问题的历史问题,当该预设时间段为近一个月之内时,即表示获取近一个月之内一个或多个同一会话中包含有简问问题和完整问题的历史问题。

根据本实施例的一个应用场景例如:通过查询历史日志数据,发现用户A在近一个月之内进行了5次会话,则通过该步骤S101获取到的5次会话中包含有简问问题和完整问题的每次会话中的历史问题都将执行后续步骤S102至S106的处理。可以理解的是,如果同一会话中仅仅包括完整问题,在历史问题召回时,直接通过现有的处理方式将该完整问题直接进行召回即可。在同一会话中仅仅包括简问问题的情况出现的可能性极小,如果识别到同一会话中仅仅包括有简问问题,则认为该会话中该简问问题没有对应相似的普通常规问题,不在本实施例的考虑范围之内。

在其中一个实施例中,可以通过历史问题语句的字数判断该历史问题是不是简问问题,即:

识别所述历史问题的语句所包含的字数;

当所述历史问题的语句所包含的字数少于预设字数时,判断所述历史问题为简问问题,否则,判断所述历史问题为完整问题。

其中,该预设字数例如为5个字,即当历史问题语句的字数在5个以下时,判断该历史问题为简问问题,否则,判断该历史问题为完整问题。

在其他实施例中,还可以通过判断该历史问题的语句中所包含的不同实体的个数判断该历史问题是否为简问问题,具体通过以下步骤来实现:

对所述历史问题进行分词处理,得到多个词语;

根据预先存储的映射关系表,查询各所述词语所属的实体;

当查询得到的不同实体的数量为两个或者两个以上时,判断所述历史问题为完整问题,否则,判断所述历史问题为简问问题。

根据本实施例的一个应用场景例如:现有历史问题“感冒可以投保e生保吗?”、“肺炎呢?”,对这两个历史问题进行分词和查询后,得到的实体分别为“疾病、保险类别”和“疾病”,即可判断“感冒可以投保e生保吗?”为完整问题,“肺炎呢?”为简问问题。

S102、将每个所述简问问题与任意一所述完整问题两两进行组合,得到多组历史问题。

可以理解的是,当所述简问问题的个数仅有一个时,需要将该简问问题与每个所述完整问题依次进行两两组合,得到对应组的历史问题。当同一会话中的简问问题的个数有多个时,需要将每个简问问题与各所述完整问题两两进行组合。

S103、通过预先训练好的问题对比模型的第一编码层和第二编码层分别对组合后的每组所述历史问题中的简问问题和完整问题分别进行编码,得到第一编码特征和第二编码特征。

在本实施例中,该问题对比模型的结构示意图如图4所示,该问题对比模型包括相互独立的第一编码层和第二编码层,该第一编码层的输出连接第一全连接层,该第二编码层的输出连接第二全连接层,该第一全连接层和第二全连接层同时连接该问题对比模型的分类层。

在其中一个实施例中,该第一编码层和该第二编码层均可以采用Bert、Bi-lstm等模型进行编码,图4中的Project表示全连接网络。

在其中一个实施例中,训练所述问题对比模型的步骤包括以下步骤S401至S406:

S401、从历史日志数据中获取会话问题训练样本对,所述会话问题训练样本对包括属于同一会话中的正例样本对和属于不同会话中的反例样本对,每对所述正例样本包括语义相似的简问问题和完整问题,每对所述反例样本包括语义不相关的简问问题和完整问题。

可以理解的是,每对所述会话问题训练样本均携带有标签,该标签用于标注对应的会话问题训练样本对为正例还是反例。在其中的一个实施例中,可以用“0”标签标注该会话问题训练样本对为正例,用“1”标签标注该会话问题训练样本对为反例。

S402、通过待训练的问题对比模型的第一编码层对所述会话问题训练样本对中的完整问题进行编码,得到第一样本编码特征,通过所述待训练的问题对比模型的第二编码层对所述会话问题训练样本对中的简问问题进行编码,得到第二样本编码特征。

S403、通过待训练的问题对比模型的第一全连接层将所述第一样本编码特征转换为第一文本样本特征,通过待训练的问题对比模型的第二全连接层将所述第二样本编码特征转换为第二文本样本特征。

S404、计算所述第一文本样本特征与所述第二文本样本特征之间的对比损失。

在其中一个实施例中,通过以下步骤计算所述第一文本样本特征与所述第二文本样本特征之间的对比损失:

其中,z

S405、根据所述对比损失及损失函数计算所述待训练的问题对比模型的最终损失。

在其中一个实施例中,所述损失函数为:

其中,z

可以理解的是,在训练该问题对比模型的过程中,会话问题训练样本对是分批次输入该问题对比模型的,每批次包括的会话问题训练样本对的数量相同,每批该会话问题训练样本对中包含的正例样本对和反例样本对的数量可以相同也可以不同。

在其中一个实施例中,τ值越小表示在训练过程中正例样本对该问题对比模型的影响越大,作为可选地,τ∈[0.05,0.1]。

S406、根据所述最终损失判断所述待训练的问题对比模型的损失函数是否收敛,当所述损失函数没有收敛时,调节所述待训练的问题对比模型的参数,循环所述从历史日志数据中获取会话问题训练样本对至本步骤,直至所述待训练的问题对比模型的损失函数收敛时,得到训练好的问题对比模型。

S104、通过预先训练好的问题对比模型的第一全连接层将所述第一编码特征转换为第一文本特征,通过预先训练好的问题对比模型的第二全连接层将所述第二编码特征转换为第二文本特征。

可以理解的是,该第一编码层的输出连接该第一全连接层的输入,该第二编码层的输出连接该全连接层的输入。

S105、将所述第一文本特征和所述第二文本特征分别输入所述预先训练好的问题对比模型的分类层,得到对应组中的简问问题和完整问题是否为相似问题的预测结果。

在其中一个实施例中,该训练好的问题对比模型的分类层主要用于根据该第一文本特征和该第二文本特征计算相似度,根据计算出的相似度判断对应组中的简问问题和完整问题是否为同类问题。

S106、当所述预测结果表示对应组中的简问问题和完整问题为相似问题时,将所述简问问题和所述完整问题同时进行召回。

根据本实施例的一个应用场景例如:在同一会话中包含的完整问题为“感冒可以投保e生保吗?”,简问问题为“意外险呢?”,将该完整问题依次转换为第一编码特征和第一文本特征,将该简问问题依次转换为第二编码特征和第二文本特征,然后通过该问题对比模型的分类层输出该简问问题和该完整问题是否为相似问题的预测结果,当该预测结果为是时,在进行历史问题召回时,将该“感冒可以投保e生保吗?”、“意外险呢?”同时进行召回。

本实施例通过获取同一会话中包含有简问问题和完整问题的历史问题,并将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题,然后通过预先训练好的问题对比模型分析每组历史问题中的简问问题和完整问题是否存在相似问的情况,当存在时,将该简问问题和对应的完整问题同时进行召回,一般属于同一会话中的历史问题存在相似问的可能性较大,本发明在对历史问题进行召回的过程中通过预先训练好的问题对比模型结合了同一会话中的历史问题所在的上下文,能够将用户简问地与完整问题相似的问题一同进行召回,提高基于人工智能的历史问题召回率,使得历史问题召回的效果更好。

图3是本发明另一实施例中基于人工智能的历史问题召回方法的一流程图,在其中一个实施例中,如图3所示,该方法在包括上述步骤S101至S105的基础上,在所述当所述预测结果表示对应组中的简问问题和完整问题为相似问题的步骤之后,所述方法还包括以下步骤S301至S304:

S301、对所述完整问题进行分词处理,得到多个第一词语,对所述简问问题进行分词处理,得到至少一个第二词语;

S302、根据预先存储的映射关系表,查询各所述第一词语所属的实体,查询各所述第二词语所属的实体;

S303、将所属实体相同的第二词语对所述的完整问题中对应实体的第一词语进行替换,得到所述简问问题的完整化问题;

所述将所述简问问题和所述完整问题同时进行召回的步骤进一步为以下步骤S304:

S304、将所述完整问题和与所述简问问题相对应的完整化问题同时进行召回。

在其中一个实施例中,所述实体的种类包括但不限于疾病、年龄、险种等。

根据本实施例的一个应用场景例如:当需要同时进行召回的完整问题为“感冒可以投保e生保吗?”,简问问题为“肺炎呢?”,在分词后进行实体查询时,得到“感冒”与“肺炎”所属的实体均为疾病,在进行词语替换后,得到所述简问问题的完整化问题为“肺炎可以投保e生保吗?”。

根据本实施例的另一应用场景例如:当需要同时进行召回的完整问题为“感冒可以投保e生保吗?”,简问问题为“意外险呢?”,在分词后进行实体查询时,得到“e生保”与“意外险”所属的实体均为险种,在进行词语替换后得到该简问问题的完整化问题为“感冒可以投保意外险吗?”。

可以理解的是,在将该完整问题及与该简问问题相对应的完整问题同时进行召回时,显示出的结果为该完整问题和进行词语替换后的完整问题。

本实施例通过将相似问题中的简问问题补充完整,并与对应的普通的问题一起召回和显示,使得用户在进入智能问答系统之后、提问之前,用户可以更清楚、完整地了解自己曾今问过的历史问题以及还可能想问的问题,在进行历史问题召回时更为全面、准确和清楚。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种基于人工智能的历史问题召回装置,该基于人工智能的历史问题召回装置与上述实施例中基于人工智能的历史问题召回方法一一对应。如图5所示,该基于人工智能的历史问题召回装置100包括问题获取模块11、组合模块12、编码模块13、转换模块14、预测模块15和召回模块16。各功能模块详细说明如下:

问题获取模块11,用于获取同一会话中包含有简问问题和完整问题的历史问题。

其中,可以将同一用户ID在预设时间间隔之间提出的历史问题确定为同一会话中的历史问题,该预设的时间间隔例如为5分钟。可以理解的是,本实施例并不限于获取一个同一会话中的历史问题,也可以根据业务需要获取多个会话中包含有简问问题和完整问题的历史问题,例如,获取近预设时间段内一个或多个同一会话中包含有简问问题和完整问题的历史问题,当该预设时间段为近一个月之内时,即表示获取近一个月之内一个或多个同一会话中包含有简问问题和完整问题的历史问题。

根据本实施例的一个应用场景例如:通过查询历史日志数据,发现用户A在近一个月之内进行了5次会话,则通过该问题获取模块11获取到的5次会话中包含有简问问题和完整问题的每次会话中的历史问题都将通过后续模块12至16进行处理。可以理解的是,如果同一会话中仅仅包括完整问题,在历史问题召回时,直接通过现有的处理方式将该完整问题直接进行召回即可。在同一会话中仅仅包括简问问题的情况出现的可能性极小,如果识别到同一会话中仅仅包括有简问问题,则认为该会话中该简问问题没有对应相似的普通常规问题,不在本实施例的考虑范围之内。

组合模块12,用于将每个该简问问题与任意一该完整问题两两进行组合,得到多组历史问题。

可以理解的是,当所述简问问题的个数仅有一个时,需要将该简问问题与每个所述完整问题依次进行两两组合,得到对应组的历史问题。当同一会话中的简问问题的个数有多个时,需要将每个简问问题与各所述完整问题两两进行组合。

编码模块13,用于通过预先训练好的问题对比模型的第一编码层和第二编码层分别对组合后的每组该历史问题中的简问问题和完整问题分别进行编码,得到第一编码特征和第二编码特征。

在本实施例中,该问题对比模型的结构示意图如图4所示。在其中一个实施例中,该第一编码层和该第二编码层均可以采用Bert、Bi-lstm等模型进行编码,图4中的Project表示全连接网络。

转换模块14,用于通过预先训练好的问题对比模型的第一全连接层将该第一编码特征转换为第一文本特征,通过预先训练好的问题对比模型的第二全连接层将该第二编码特征转换为第二文本特征。

可以理解的是,该第一编码层的输出连接该第一全连接层的输入,该第二编码层的输出连接该全连接层的输入。

预测模块15,用于将该第一文本特征和该第二文本特征分别输入该预先训练好的问题对比模型的分类层,得到对应组中的简问问题和完整问题是否为相似问题的预测结果。

在其中一个实施例中,该训练好的问题对比模型的分类层主要用于根据该第一文本特征和该第二文本特征计算相似度,根据计算出的相似度判断对应组中的简问问题和完整问题是否为同类问题。

召回模块16,用于当该预测结果表示对应组中的简问问题和完整问题为相似问题时,将该简问问题和该完整问题同时进行召回。

根据本实施例的一个应用场景例如:在同一会话中包含的完整问题为“感冒可以投保e生保吗?”,简问问题为“意外险呢?”,将该完整问题依次转换为第一编码特征和第一文本特征,将该简问问题依次转换为第二编码特征和第二文本特征,然后通过该问题对比模型的分类层输出该简问问题和该完整问题是否为相似问题的预测结果,当该预测结果为是时,在进行历史问题召回时,将该“感冒可以投保e生保吗?”、“意外险呢?”同时进行召回。

本实施例提出的基于人工智能的历史问题召回装置100通过预先训练好的问题对比模型分析同一会话中是否存在与完整问题相似的简问问题,当存在时,将该简问问题和对应的完整问题同时进行召回,使得在对历史问题进行召回的过程中结合了历史问题所在的上下文,能够将用户简问的相似问题一同进行召回,使得历史问题召回的效果更好。

在其中一个实施例中,所述问题获取模块11进一步包括:

第一分词单元,用于对该历史问题进行分词处理,得到多个词语;

第一查询单元,用于根据预先存储的映射关系表,查询各该词语所属的实体;

第一判断单元,用于当查询得到的不同实体的数量为两个或者两个以上时,判断该历史问题为完整问题,否则,判断该历史问题为简问问题。

根据本实施例的一个应用场景例如:现有历史问题“感冒可以投保e生保吗?”、“肺炎呢?”,对这两个历史问题进行分词和查询后,得到的实体分别为“疾病、保险类别”和“疾病”,即可判断“感冒可以投保e生保吗?”为完整问题,“肺炎呢?”为简问问题。

在另一实施例中,该问题获取模块11具体包括:

字数识别单元,用于识别所述历史问题的语句所包含的字数;

第二判断单元,用于当所述历史问题的语句所包含的字数少于预设字数时,判断所述历史问题为简问问题,否则,判断所述历史问题为完整问题。

其中,该预设字数例如为5个字,即当历史问题语句的字数在5个以下时,判断该历史问题为简问问题,否则,判断该历史问题为完整问题。

在其中一个实施例中,该基于人工智能的历史问题召回装置100还包括:

会话样本获取模块,用于从历史日志数据中获取会话问题训练样本对,该会话问题训练样本对包括属于同一会话中的正例样本对和属于不同会话中的反例样本对,每对该正例样本包括语义相似的简问问题和完整问题,每对该反例样本包括语义不相关的简问问题和完整问题;

样本编码模块,用于通过待训练的问题对比模型的第一编码层对该会话问题训练样本对中的完整问题进行编码,得到第一样本编码特征,通过该待训练的问题对比模型的第二编码层对该会话问题训练样本对中的简问问题进行编码,得到第二样本编码特征;

样本转换模块,用于通过待训练的问题对比模型的第一全连接层将该第一样本编码特征转换为第一文本样本特征,通过待训练的问题对比模型的第二全连接层将该第二样本编码特征转换为第二文本样本特征;

第一计算模块,用于计算该第一文本样本特征与该第二文本样本特征之间的对比损失;

第二计算模块,用于根据该对比损失及损失函数计算该待训练的问题对比模型的最终损失;

循环模块,用于根据该最终损失判断该待训练的问题对比模型的损失函数是否收敛,当该损失函数没有收敛时,调节该待训练的问题对比模型的参数,循环该从历史日志数据中获取会话问题训练样本对至本步骤,直至该待训练的问题对比模型的损失函数收敛时,得到训练好的问题对比模型。

其中,每对所述会话问题训练样本均携带有标签,该标签用于标注对应的会话问题训练样本对为正例还是反例。在其中的一个实施例中,可以用“0”标签标注该会话问题训练样本对为正例,用“1”标签标注该会话问题训练样本对为反例。

在其中一个实施例中,所述第一计算模块具体用于通过以下公式计算该对比损失:

其中,z

在其中一个实施例中,所述损失函数为:

其中,z

可以理解的是,在训练该问题对比模型的过程中,会话问题训练样本对是分批次输入该问题对比模型的,每批次包括的会话问题训练样本对的数量相同,每批该会话问题训练样本对中包含的正例样本对和反例样本对的数量可以相同也可以不同。

在其中一个实施例中,τ值越小表示在训练过程中正例样本对该问题对比模型的影响越大,作为可选地,τ∈[0.05,0.1]。

作为可选地,该基于人工智能的历史问题召回装置100还包括:

第一分词模块,用于对该完整问题进行分词处理,得到多个第一词语;

第二分词模块,用于对该简问问题进行分词处理,得到至少一个第二词语;

映射模块,用于根据预先存储的映射关系表,查询各该第一词语所属的实体,查询各该第二词语所属的实体;

替换模块,用于将所属实体相同的第二词语对该的完整问题中对应实体的第一词语进行替换,得到该简问问题的完整化问题。

在其中一个实施例中,该召回模块16具体用于:将该完整问题和与该简问问题相对应的完整化问题同时进行召回。

在其中一个实施例中,所述实体的种类包括但不限于疾病、年龄、险种等。

根据本实施例的一个应用场景例如:当需要同时进行召回的完整问题为“感冒可以投保e生保吗?”,简问问题为“肺炎呢?”,在分词后进行实体查询时,得到“感冒”与“肺炎”所属的实体均为疾病,在进行词语替换后,得到所述简问问题的完整化问题为“肺炎可以投保e生保吗?”。

根据本实施例的另一应用场景例如:当需要同时进行召回的完整问题为“感冒可以投保e生保吗?”,简问问题为“意外险呢?”,在分词后进行实体查询时,得到“e生保”与“意外险”所属的实体均为险种,在进行词语替换后得到该简问问题的完整化问题为“感冒可以投保意外险吗?”。

可以理解的是,在将该完整问题及与该简问问题相对应的完整问题同时进行召回时,显示出的结果为该完整问题和进行词语替换后的完整问题。

本实施例通过将相似问题中的简问问题补充完整,并与对应的普通的问题一起召回和显示,使得用户在进入智能问答系统之后、提问之前,用户可以更清楚、完整地了解自己曾今问过的历史问题以及还可能想问的问题,在进行历史问题召回时更为全面、准确和清楚。

其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。

关于基于人工智能的历史问题召回装置的具体限定可以参见上文中对于基于人工智能的历史问题召回方法的限定,在此不再赘述。上述基于人工智能的历史问题召回装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质包括非易失性存储介质和/或易失性的存储介质,该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于人工智能的历史问题召回方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的历史问题召回方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质包括非易失性存储介质和/或易失性的存储介质,该存储介质存储有操作系统和计算机程序。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的历史问题召回方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于人工智能的历史问题召回方法的步骤,例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中基于人工智能的历史问题召回装置的各模块/单元的功能,例如图5所示模块11至模块16的功能。为避免重复,这里不再赘述。

所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。

所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于人工智能的历史问题召回方法的步骤,例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中基于人工智能的历史问题召回装置的各模块/单元的功能,例如图5所示模块11至模块16的功能。为避免重复,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性和/或易失性的计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号