首页> 中国专利> 基于关键词的问题排序方法、智能机器人以及计算机设备

基于关键词的问题排序方法、智能机器人以及计算机设备

摘要

本发明提供了一种基于关键词的问题排序方法、智能机器人以及计算机设备,其中,方法包括:检测距离当前预设时段内的各个业务处理类别所占的比例;根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题;并根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词;根据预设的热度计算方法计算每个所述目标问题的热度熵值;根据每个关键词对应的各所述目标问题的热度熵值,对每个关键词的对应的各所述目标问题进行排序。本发明的有益效果:通过本发明的关键词的问题排序方法,能够使用户基于搜索的关键词按热度罗列问题,使智能机器人可以回答大多数用户的询问,极大的缓解了客服人员的压力。

著录项

  • 公开/公告号CN112434146A

    专利类型发明专利

  • 公开/公告日2021-03-02

    原文格式PDF

  • 申请/专利权人 平安普惠企业管理有限公司;

    申请/专利号CN202011344673.0

  • 发明设计人 亢宁;

    申请日2020-11-25

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/338(20190101);G06F16/35(20190101);

  • 代理机构44343 深圳市明日今典知识产权代理事务所(普通合伙);

  • 代理人王杰辉;陈秋波

  • 地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2023-06-19 10:05:17

说明书

技术领域

本发明涉及人工智能技术领域,特别涉及一种基于关键词的问题排序方法、智能机器人以及计算机设备。

背景技术

为了缓解客服的压力,许多公司推出了智能机器人来回答用户的问题,但是由于面向的用户比较多,受限于智能机器人的缓存大小,目前在智能机器人中只是缓存一些常见的问题,无法做到与现实热度接轨,智能性较差。因此,亟需一种基于关键词的问题排序方法,实现根据热度为用户罗列问题,便于用户找寻问题的答案。

发明内容

本发明的主要目的为提供一种基于关键词的问题排序方法、智能机器人以及计算机设备,旨在解决在智能机器人中只是缓存一些常见的问题,无法做到与现实热度接轨的问题。

本发明提供了一种基于关键词的问题排序方法,包括:

检测距离当前预设时段内的各个业务处理类别所占的比例;

根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题;其中所述目标问题包括题目以及对应的答案;

根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词;

根据预设的热度计算方法计算每个所述目标问题的热度熵值;

根据每个关键词对应的各所述目标问题的热度熵值,对每个关键词的对应的各所述目标问题进行排序。

进一步地,所述根据预设的热度计算方法计算每个所述目标问题的热度熵值的步骤,包括:

获取每个目标问题在预设时间段内的检索次数;

根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值。

进一步地,所述根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值的步骤之前,包括:

获取各检索次数分别对应的热度指标值;

将所述热度指标值通过第一预设公式进行标准化处理,得到对应的热度熵值。

进一步地,所述根据每个所述关键词对应的各热度熵值,对每个所述关键词对应的各所述目标问题进行排序的步骤之后,还包括:

获取所述智能机器人未回答准确的特殊问题;

基于所述关键词库对所述特殊问题进行预处理,以得到所述特殊问题的标准化问题;

将所述标准化问题输入至预设的机器学习模型进行计算,以对所述标准化问题进行分类处理;

将所述标准化问题以及对应的类别输入至反馈模型中;

根据所述反馈模型获取推荐答案,并将获取到的所述推荐答案负反馈于所述智能机器人。

进一步地,所述检测距离当前预设时段内的各个业务处理类别所占的比例的步骤,包括:

获取各所述处理业务对应的业务信息;

将所述业务信息输入至预训练的向量机中,得到对应的业务向量;

根据第二预设公式计算得到与各个类别对应的类别向量的余弦值,其中,通过将各类别的业务信息分别进行向量化后得到,对应的所述类别向量的多维坐标;

根据各所述余弦值判断各所述业务信息的类别;

根据各所述业务信息的类别得到各个类别所占的比例。

进一步地,所述根据每个所述关键词对应的各热度熵值,对每个所述关键词对应的各所述目标问题进行排序的步骤之后,还包括:

接收用户输入的检索词,并将所述检索词进行标准化处理,得到对应的标准词汇;

将所述标准词汇与所述关键词库中的关键词进行匹配;

根据匹配后的所述关键词,获取其排序后的所述目标问题,将各排序后的所述目标问题反馈给所述用户。

本发明提供了一种基于关键词的问题排序装置,包括:

比例检测模块,用于检测距离当前预设时段内的各个业务处理类别所占的比例;

目标问题获取模块,用于根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题;其中所述目标问题包括题目以及对应的答案;

关键词提取模块,用于根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词;

热度熵值计算模块,用于根据预设的热度计算方法计算每个所述目标问题的热度熵值;

排序模块,用于根据每个所述关键词对应的各热度熵值,对每个所述关键词对应的各所述目标问题进行排序。

进一步地,所述热度熵值计算模块,包括:

检索次数获取子模块,用于获取每个目标问题在预设时间段内的检索次数;

热度熵值计算子模块,用于根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值。

本发明提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本发明的有益效果:通过本发明的关键词的问题排序方法,能够使用户基于搜索的关键词,按热度罗列问题,使智能机器人可以回答大多数用户的询问,极大的缓解了客服人员的压力,另外,只获取预设个数的对应的目标问题,保证回答的问题能解决大多数用户疑惑,且不会影响智能机器人的计算速度,使用户的体验效果更佳。

附图说明

图1是本发明一实施例的一种基于关键词的问题排序方法的流程示意图;

图2是本发明一实施例的一种基于关键词的问题排序方法的结构示意框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。

另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

参照图1,本发明提出一种基于关键词的问题排序方法,包括:

S1:检测距离当前预设时段内的各个业务处理类别所占的比例;

S2:根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题;其中所述目标问题包括题目以及对应的答案;

S3:根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词;

S4:根据预设的热度计算方法计算每个所述目标问题的热度熵值;

S5:根据每个所述关键词对应的各所述目标问题的热度熵值,对每个所述关键词的对应的各所述目标问题进行排序。

如上述步骤S1所述,检测距离当前预设时段内的各个业务处理类别所占的比例。具体的检测方式可以是,通过获取预时段内的处理业务,然后根据处理业务所属的类别,求出处理业务在各个类别分别占据的比例,即获取所有处理业务的总数量,以及各个类别对应的处理业务数量,将各个类别对应的处理数量比上取所有处理业务的总数量,即得到各个类别分别占据的比例。

如上述步骤S2所述,根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题。由于智能机器人会面向很多的客户,因此单个的智能机器人的内存不宜设置过大,否则容易造成成本过高,而为了使用户提出的问题可以得到相应的回答,因此可以根据各类别的比例获取对应的目标问题,例如,若旅游险类别的问题较多,则可以只获取旅游类别的目标问题。另外,预设个数为事先设定的个数,应当理解的是,受限于智能机器人的缓存和计算能力,预设个数的具体个数不宜太多,以免增加智能机器人的计算过程,导致智能机器人不能及时反应用户的问题,给用户造成不好的体验。

如上述步骤S3所述,根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词。为了对各个目标问题进行归类,检索,一般会提取目标问题中的关键词,关键词可以是名称,金额,事项,日期等,一个目标问题一般会对应多个关键词,同样一个关键词也有可能对应多个目标问题,提取每个目标问题中的关键词与目标问题建立对应关系。

如上述步骤S4所述,根据预设的热度计算方法计算每个所述目标问题的热度熵值。在不同的时间段,不同的目标问题具有不同的热度熵值,当热度熵值比较高时,说明该目标问题被询问的概率比较大,当热度熵值比较低时,说明该目标问题被询问的概率比较小。预设的热度计算方法可以是预先设置目标问题被检索的次数与热度熵值的对应关系。然后根据对应的检索次数获取每个目标问题的热度熵值。也可以是构建其他的函数关系。

如上述步骤S5所述,根据每个关键词对应的各所述目标问题的热度熵值,对每个关键词的对应的各所述目标问题进行排序。对应每个目标问题的热度熵值均已计算得到,在进行关键词检索时,会出现对应该关键词的多个目标问题,因此可以根据热度熵值进行排序,然后将排序的界面呈现或发送给对应的用户。

在一个实施例中,所述根据预设的热度计算方法计算每个所述目标问题的热度熵值的步骤S4,包括:

S401:获取每个目标问题在预设时间段内的检索次数;

S402:根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值。

如上述步骤S401-S402所述,实现了根据目标问题的检索次数计算热度熵值。通过获取每个目标问题的在预设时间段内的检索次数,该检索次数可以是通过计数器对检测次数进行统计得到,也可以采集目标问题的访问次数得到。根据检索次数与热度熵值的对应函数关系,例如可以为一次函数关系,也可以是二次函数对应关系,应当理解是,随着检索次数的增加,对应的热度熵值也应当增加,即函数关系为增函数。

在一个实施例中,所述根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值的步骤S402之前,包括:

S4011:获取各检索次数分别对应的热度指标值;

S4012:将所述热度指标值通过第一预设公式进行标准化处理,得到对应的热度熵值。

如上述步骤S4011-S4012所述,实现了设定检索次数与热度熵值的函数关系。通过获取热度指标值,即不同的检索次数对应不同的热度指标值,热度指标值与检索次数呈正相关,当然,不需要获取所有的检索次数与热度指标值的对应关系,只需要获取预设数量的检索次数与对应的热度指标值即可,该预设数量可以事先进行设定,可以满足找出检索次数与热度指标值的对应关系即可。具体地,热度指标值{h

在一个实施例中,所述根据每个关键词对应的各所述目标问题的热度熵值,对每个关键词的对应的各所述目标问题进行排序的步骤S5之后,还包括:

S601:获取所述智能机器人未回答准确的特殊问题;

S602:基于所述关键词库对所述特殊问题进行预处理,以得到所述特殊问题的标准化问题;

S603:将所述标准化问题输入至预设的机器学习模型进行计算,以对将所述标准化问题进行分类处理;

S604:将所述标准化问题以及对应的业务处理类别输入至反馈模型中;

S605:根据所述反馈模型获取推荐答案,并将获取到的所述推荐答案负反馈于所述智能机器人。

如上述步骤S601-S605所述,实现了对未回答准确的特殊问题的处理。即先采集未能回答准确的特殊问题,采集的特殊问题可以是语音格式,也可以是文字格式,若为语音格式,可以通过语音识别技术将其转化为文字格式。

然后根据关键词库对特殊问题进行预处理,预处理包括对词句中的词语进行转换、对脏词进行清洗和过滤,对重复的问题和词语进行去重,对同义词进行替换,对未完整的语句按照句意进行补充等。

将标准化文本输入至预设的机器学习模型进行计算,计算的方式为根据提取的关键词进行分类处理,使后续可以去数据库中对应的位置处搜寻答案,而不需要遍历整个数据库。

将标注化后的问题输入至一个反馈模型中,通过反馈模型获取问题的答案。在获取到了答案后也可以根据所属的类别导入至智能机器人的设定缓存位置,使实现对未回答准确问题的扩充。其中,反馈模型为与数据库接轨的模型,即反馈模型内存储有与数据库接轨的协议,通过反馈模型获取到相应的答案后,通过该协议实现将问题以及对应的答案上传至数据库中。另外,反馈模型中还可以分为多个类别,在检测出特殊问题的类别后,将特殊问题保存在反馈模型中的对应类别处,获取答案时,可以根据该类别进行获取,另外,将答案上传至数据库中也可以根据类别进行上传,节省了获取答案和上传的时间。

在一个实施例中,所述检测距离当前预设时段内的各个业务处理类别所占的比例的步骤S1,包括:

S101:获取各所述处理业务对应的业务信息;

S102:将所述业务信息输入至预训练的向量机中,得到对应的业务向量;

S103:根据第二预设公式计算得到与各个类别对应的类别向量的余弦值,其中,通过将各类别的业务信息分别进行向量化后得到,对应的所述类别向量的多维坐标;

S104:根据各所述余弦值判断各所述业务信息的类别;

S105:根据各所述业务信息的类别得到各个类别所占的比例。

如上述步骤S101-S103所述,实现了计算各个业务处理类别所占的比例。即先获取到各处理业务对应的业务信息,获取方式可以是对获取预设时间段内所有的业务,然后提取其中与类别相关的部分(即业务信息),然后将其输入至预训练的向量机中,该向量机由事先根据不同的业务以及设定的类别训练而成,然后以得到对应的业务向量,然后根据公式进行计算业务向量与各类别向量的余弦值,其中余弦值cosθ值越趋近于1时,表明业务向量与该类别向量相似度越高,余弦值cosθ值越趋近于-1时,表明业务向量与该类别向量相似度越低。其中,设定业务向量的多维坐标为X=(x

如上述步骤S104-S105所述,在计算出文本信息与各个类别的余弦值时,可以将余弦值最大的一个类别作为该文本信息的类别,由此,获取各业务信息的类别,对各业务信息的类别进行数目统计,计算出各个类别所占的比例,从而实现了计算各个业务处理类别所占的比例。

在一个实施例中,所述根据每个关键词对应的各所述目标问题的热度熵值,对每个关键词的对应的各所述目标问题进行排序的步骤S5之后,还包括:

S611:接收用户输入的检索词,并将所述检索词进行标准化处理,得到对应的标准词汇;

S612:将所述标准词汇与所述关键词库中的关键词进行匹配;

S613:根据匹配后的所述关键词,获取其排序后的所述目标问题,将各排序后的所述目标问题反馈给所述用户。

如上述步骤S611-S613所述,实现了给用户根据搜索的检索词,按照热度呈现目标问题。即先根据用户的检索词,然后先进行标准化处理,即同义词转化等,得到对应的标准词汇,再根据标准词汇与关键词库中的关键词进行匹配,按照该关键词对应目标问题的热度对用户进行反馈,即实现了用户只需要输入检索词,就能基于该关键词对目标问题进行获取排序,使智能机器人可以回答用户的询问,另外,还可以将用户选择的目标问题对应的答案,以语音播报的形式进行播放。

参照图2,本发明提出一种基于关键词的问题排序装置,包括:

比例检测模块10,用于检测距离当前预设时段内的各个业务处理类别所占的比例;

目标问题获取模块20,用于根据各业务处理类别所占的比例,通过智能机器人获取问题库中对应的预设数量的目标问题;其中所述目标问题包括题目以及对应的答案;

关键词提取模块30,用于根据预设的关键词库提取各所述目标问题中对应的一个或者多个关键词;

热度熵值计算模块40,用于根据预设的热度计算方法计算每个所述目标问题的热度熵值;

排序模块50,用于根据每个所述关键词对应的各热度熵值,对每个所述关键词对应的各所述目标问题进行排序。

在一个实施例中,热度熵值计算模块40,包括:

检索次数获取子模块,用于获取每个目标问题在预设时间段内的检索次数;

热度熵值计算子模块,用于根据所述检索次数以及所述检索次数与所述热度熵值的对应函数关系,计算对应的所述热度熵值。

在一个实施例中,热度熵值计算模块40,包括:

热度指标值获取子模块,用于获取各检索次数分别对应的热度指标值;

标准化处理子模块,将所述热度指标值通过第一预设公式进行标准化处理,得到对应的热度熵值。

在一个实施例中,基于关键词的问题排序装置,还包括:

特殊问题获取模块,用于获取所述智能机器人未回答准确的特殊问题;

预处理模块,用于基于所述关键词库对所述特殊问题进行预处理,以得到所述特殊问题的标准化问题;

分类处理模块,用于将所述标准化问题输入至预设的机器学习模型进行计算,以对将所述标准化问题进行分类处理;

输入模块,用于将所述标准化问题以及对应的业务处理类别输入至反馈模型中;

负反馈模块,用于根据所述反馈模型获取推荐答案,并将获取到的所述推荐答案负反馈于所述智能机器人。

在一个实施例中,比例检测模块10,包括:

业务信息获取子模块,用于获取各所述处理业务对应的业务信息;

输入子模块,用于将所述业务信息输入至预训练的向量机中,得到对应的业务向量;

余弦值计算子模块,用于根据第二预设公式:计算得到与各个类别对应的类别向量的余弦值,其中,通过将各类别的业务信息分别进行向量化后得到,对应的所述类别向量的多维坐标;

类别判断子模块,用于根据各所述余弦值判断各所述业务信息的类别;

比例计算子模块,用于根据各所述业务信息的类别得到各个类别所占的比例。

在一个实施例中,基于关键词的问题排序装置,还包括:

标准化处理模块,用于接收用户输入的检索词,并将所述检索词进行标准化处理,得到对应的标准词汇;

匹配模块,用于将所述标准词汇与所述关键词库中的关键词进行匹配;

呈现模块,用于根据匹配后的所述关键词,获取其排序后的所述目标问题,将各排序后的所述目标问题反馈给所述用户。

本发明的有益效果:通过本发明的关键词的问题排序方法,能够使用户基于搜索的关键词,按热度罗列问题,使智能机器人可以回答大多数用户的询问,极大的缓解了客服人员的压力,另外,只获取预设个数的对应的目标问题,保证回答的问题能解决大多数用户疑惑,且不会影响智能机器人的计算速度,使用户的体验效果更佳。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种问题的题目和答案等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的基于关键词的问题排序方法。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的基于关键词的问题排序方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号