首页> 中国专利> 对话型文本分类方法、系统、设备及存储介质

对话型文本分类方法、系统、设备及存储介质

摘要

本发明提供了一种对话型文本分类方法、系统、设备及存储介质,该方法包括:获取待分类的对话型文本;提取所述待分类的对话型文本的待分类文本特征;将所述待分类文本特征输入训练好的对话型文本分类模型;获取所述对话型文本分类模型输出的对话类别,所述对话类别包括业务对话类别和闲聊对话类别;如果所述对话类别为业务对话,提高所对应的对话优先级;如果所述对话类别为闲聊对话,并对所对应的对话进行计数或计时,并于所述对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级。本发明对对话型文本进行识别和分类,针对闲聊对话客户提供闲聊服务,并为业务对话客户提供更快、更好的业务服务。

著录项

  • 公开/公告号CN113282755A

    专利类型发明专利

  • 公开/公告日2021-08-20

    原文格式PDF

  • 申请/专利权人 上海寻梦信息技术有限公司;

    申请/专利号CN202110655090.8

  • 发明设计人 不公告发明人;

    申请日2021-06-11

  • 分类号G06F16/35(20190101);G06F16/332(20190101);

  • 代理机构31282 上海隆天律师事务所;

  • 代理人夏彬

  • 地址 200050 上海市长宁区娄山关路533号2902-2913室

  • 入库时间 2023-06-19 12:18:04

说明书

技术领域

本发明涉及数据处理技术领域,尤其涉及一种对话型文本分类方法、系统、设备及存储介质。

背景技术

在物流客服解答用户物流问题的过程中,用户会有一些承上启下的闲聊对话内容,而闲聊对话的诶荣范围比较广阔无限。

在用户与物流客服的对话场景中,有些用户会向客服咨询物流业务问题,也有些用户仅向物流客服发出无实际意图或目的的闲聊,由于物流客服的接待人数、回复精力有限,如在与用户的闲聊对话中花费过多时间,则无法及时、准确地为真正需要解决问题的用户提供服务。为了提高客户的服务体验,需要对闲聊对话进行识别,使得智能机器人或者人工客服能够对用户物流问题提供更快、更准确的物流业务回答。

发明内容

针对现有技术中的问题,本发明的目的在于提供一种对话型文本分类方法、系统、设备及存储介质,对对话型文本进行识别和分类,针对闲聊对话客户提供闲聊服务,并为业务对话客户提供更快、更好的业务服务。

本发明实施例提供一种对话型文本分类方法,包括如下步骤:

获取待分类的对话型文本;

提取所述待分类的对话型文本的待分类文本特征;

将所述待分类文本特征输入训练好的对话型文本分类模型;

获取所述对话型文本分类模型输出的对话类别,所述对话类别包括业务对话类别和闲聊对话类别;

如果所述对话类别为业务对话,提高所对应的对话优先级;

如果所述对话类别为闲聊对话,并对所对应的对话进行计数或计时,并于所述对话持续为闲聊对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级。

在一些实施例中,所述对话型文本分类模型为二分类模型。

在一些实施例中,所述对话型文本分类模型为Liblinear二分类模型。

在一些实施例中,所述获取待分类的对话型文本,包括如下步骤:

获取待分类的客服对话型文本;

从所述待分类的客服对话型文本中提取客户对话型文本,作为待分类的对话型文本。

在一些实施例中,判断所述对话类别的类型之后,还包括如下步骤:

如果所述对话型文本分类模型输出的对话类别为业务对话类别,则识别所述待分类的对话型文本对应的业务类型,根据所述业务类型生成回复文本;

如果所述对话型文本分类模型输出的对话类别为闲聊对话类别,则基于预设的闲聊对话回复规则,生成回复文本。

在一些实施例中,还包括如下步骤:

采集样本对话型文本;

对所述样本对话型文本添加对话类别标签,所述对话类别标签包括业务对话标签和闲聊对话标签;

基于所述样本对话型文本训练所述对话型文本分类模型。

在一些实施例中,基于所述样本对话型文本训练所述对话型文本分类模型时,所述业务对话的分类权重高于所述闲聊对话的分类权重。

在一些实施例中,所述采集样本对话型文本,包括采集历史对话型文本,提取历史客户对话型文本作为所述样本对话型文本。

本发明实施例还提供一种对话型文本分类系统,应用于所述的对话型文本分类方法,所述系统包括:

文本获取模块,用于获取待分类的对话型文本;

特征提取模块,用于提取所述待分类的对话型文本的待分类文本特征;

模型输入模块,用于将所述待分类文本特征输入训练好的对话型文本分类模型;

文本分类模块,用于获取所述对话型文本分类模型输出的对话类别,所述对话类别包括业务对话类别和闲聊对话类别。

在一些实施例中,还包括模型训练模块,用于采集样本对话型文本;对所述样本对话型文本添加对话类别标签,所述对话类别标签包括业务对话标签和闲聊对话标签;以及基于所述样本对话型文本训练所述对话型文本分类模型;

所述模型训练模块基于所述样本对话型文本训练所述对话型文本分类模型时,所述业务对话的分类权重高于所述闲聊对话的分类权重;

对话处理模块,用于如果所述对话类别为业务对话,提高所对应的对话优先级;以及如果所述对话类别为闲聊对话,并对所对应的对话进行计数或计时,并于所述对话持续为闲聊对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级。

本发明实施例还提供一种对话型文本分类设备,包括:

处理器;

存储器,其中存储有所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行所述的对话型文本分类方法的步骤。

本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的对话型文本分类方法的步骤。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本发明的对话型文本分类方法、系统、设备及存储介质具有如下有益效果:

本发明对对话型文本进行识别和分类,并且根据分类结果分别提供不同的服务模式,针对闲聊对话客户提供闲聊服务,并且在满足降优先级条件时,降低闲聊对话客户的优先级,避免过多占用客服资源,也为业务对话客户提供更充足的客服资源,针对业务对话客户,提升其对应的对话优先级,从而可以为业务对话用户提供更快、更好的业务服务。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。

图1是本发明一实施例的对话型文本分类方法的流程图;

图2是本发明一实施例的生成回复文本的流程图;

图3是本发明一实施例的对业务对话进行处理的流程图;

图4是本发明一实施例的对闲聊对话进行处理的流程图;

图5是本发明一实施例的对话型文本分类模型的训练过程流程图;

图6是本发明一实施例的提取样本对话型文本的流程图;

图7是本发明一实施例的对话型文本分类系统的结构示意图;

图8是本发明一实施例的对话型文本分类设备的结构示意图;

图9是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。

如图1所示,本发明实施例提供一种对话型文本分类方法,包括如下步骤:

S100:获取待分类的对话型文本,此对话型文本可以是在客户和客服对话过程中实时采集到的对话型文本;

S200:提取所述待分类的对话型文本的待分类文本特征;

此处提取待分类文本特征可以是将对话型文本进行分词,然后对每个词获取对应的词向量,将词向量组合得到待分类文本特征,也可以通过word2vec模型或卷积神经网络等特征提取模型来提取文本特征;

S300:将所述待分类文本特征输入训练好的对话型文本分类模型;

S400:获取所述对话型文本分类模型输出的对话类别,所述对话类别包括业务对话类别和闲聊对话类别;

业务对话类别主要是跟客服业务直接相关的,例如客户咨询“快递什么时候到”,即属于物流客服的业务对话。而闲聊对话则是与客服业务没有关联的,例如,客户说“今天天气不错”,就属于闲聊对话;

S500:判断所述对话型文本分类模型输出的对话类别的类型;

S600:如果所述对话类别为业务对话,提高所对应的对话优先级;

在该实施例中,所述待分类的对话型文本是当前正在进行中的一个对话中的文本,所对应的对话指的是所述待分类的对话型文本来源的对话。

具体地,提高对话优先级的方式可以包括但不限于:机器客服直接转人工客服、提高人工客服的排队顺序、转接到高一级别或者历史评分高的人工客服、或者由通用机器人客服转接到专业机器人客服等等各种方式的一种或多种。

S700:如果所述对话类别为闲聊对话,对所对应的对话进行计数或计时,并于所述对话持续为闲聊对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级。

具体地,在当前对话类别为闲聊对话时,对所对应的对话进行计数,指的是,当前检测到正在进行的对话中的待分类的对话型文本是闲聊对话时,将闲聊对话的数量设为1,持续对该对话中新出现的对话型文本进行监测和识别,如果有新的闲聊对话出现,则将数量加1,此处持续为闲聊对话指的是连续监测到闲聊对话。如果计数的数量达到预设数量阈值,则降低所对应的对话优先级。对所对应的对话进行计时,指的是,当前检测到正在进行的对话中的待分类的对话型文本是闲聊对话时,开始计时,如果后续一直监测到闲聊对话,则时间持续增加,直到监测到业务对话为止,如果计时的时间大于预设时间阈值,则降低所对应的对话优先级。

此处,降低所对应的对话优先级可以包括但不限于:人工客服直接转机器人客服、降低人工客服的排队顺序、转接到低一级别或者历史评分低的人工客服、或者由专业机器人客服转接到通用机器人客服等等各种方式的一种或多种。

本发明的对话型文本分类方法通过步骤S100和S200获取对话型文本并提取文本特征,通过步骤S300和S400对对话型文本进行识别和分类,并且通过步骤S500~S700根据分类结果分别提供不同的服务模式,针对闲聊对话客户提供闲聊服务,并且在满足降优先级条件时,降低闲聊对话客户的优先级,避免过多占用客服资源,也为业务对话客户提供更充足的客服资源,针对业务对话客户,提升其对应的对话优先级,从而可以为业务对话用户提供更快、更好的业务服务。

本发明的对话型文本分类方法可以应用于各个服务领域的客服服务器,实时获取到客服对话中的待分类的对话型文本,并且可以根据对话型文本的分类类型确定后续的客服服务策略。客户通过使用手机、平板电脑、笔记本电脑等用户终端来与客服服务器来进行通信,客服分为机器人客服和人工客服,机器人客服的算法可以内置于客服服务系统或单独提供一个机器人客服服务器,人工客服通过其使用的电脑等终端与客服服务器来进行通信。即客服服务器建立了客户和客服之间的通信通道,客户和客服可以基于客服服务器进行对话。本发明的对话型文本分类方法也可以应用于一个单独的服务器,与客服服务器通信,从客服服务器实时获取到获取到客服对话中的待分类的对话型文本,并且可以根据对话型文本的分类类型确定后续的客服服务策略,如果客服服务策略相比于前一时刻有更新,则发送到客服服务器。

进一步地,所述步骤S700中,如果所述对话类别为闲聊对话,还可以进一步包括启动闲聊库。闲聊库是一个专门的聊天语料库,可以根据对话型文本的内容快速查找到对应的回复语句,如果当前是机器人客服,则可以根据从闲聊库中查询到的回复语句,快速反馈至客户,如果当前是人工客服,则可以从闲聊库中查询到回复语句,发送给人工客服,人工客服可以参考该回复语句快速做出应答;

在该实施例中,所述对话型文本分类模型为二分类模型,例如所述对话型文本分类模型可以为Liblinear二分类模型。其中,Liblinear是libsvm的线性核的改进版本,专门适用于百万数据量的分类。在其他可替代的实施方式中,所述对话型文本分类模型也可以为其他类型的二分类模型,例如决策树、逻辑回归模型等。此外,所述对话型文本分类模型也可以为其他类型的机器学习模型,例如卷积神经网络模型等。

在该实施例中,所述对话型文本分类方法主要针对于客户和客服对话过程中客户的对话进行分类,即根据客户所说的话的内容来判断是闲聊还是业务对话。所述步骤S100:获取待分类的对话型文本,包括如下步骤:

获取待分类的客服对话型文本,此处客服对话型文本包括客户通过其客户端发送的客户对话型文本,还包括客服对客户对话型文本进行回复的客服回复型文本;

从所述待分类的客服对话型文本中提取客户对话型文本,作为待分类的对话型文本,即仅对客户发送的对话型文本进行识别,减少对话识别的工作量,降低对话处理系统的工作负担。

如图2所示,在该实施例中,所述步骤S500:判断所述对话类别的类型之后,还包括如下步骤:

S510:如果所述对话型文本分类模型输出的对话类别为业务对话类别,则识别所述待分类的对话型文本对应的业务类型,根据所述业务类型生成回复文本,例如所述业务类型可以包括寄件查询、物流时间咨询类型、物流时效投诉类型、物流服务投诉类型等等,根据不同的业务类型可以预设不同的回复规则,例如,对于物流时间咨询类型,自动查询客户的订单,根据客户的订单自动查询物流进程并生成回复文本,对于物流时效投诉类型,首先自动生成安抚语句,然后查询预设的处理机制等,在机器人客服服务时,可以直接将回复文本推送给客户,在人工客服服务时,可以将回复文本推送给客服,辅助客服快速应答,根据业务类型的细分,也可以调整会话优先级,例如,对投诉物流时效的业务类型,提高优先级;

具体地,如图2所示,所述步骤S510:识别所述待分类的对话型文本对应的业务类型,根据所述业务类型生成回复文本可以包括如下步骤:

S511:识别所述待分类的对话型文本对应的业务类型;

S512:加载所述业务类型所对应的业务回复语料库;

S513:根据所述待分类的对话型文本和预设的业务回复匹配规则,从所述业务回复语料库中选择与所述待分类的对话型文本匹配的回复文本。

S520:如果所述对话型文本分类模型输出的对话类别为闲聊对话类别,则基于预设的闲聊对话回复规则,生成回复文本,具体地,所述预设的闲聊对话回复规则可以是与闲聊库中的闲聊语料的匹配规则,根据对话型文本和所述匹配规则,从所述闲聊库中匹配到闲聊语料,在机器人客服服务时,可以直接将回复文本推送给客户,在人工客服服务时,可以将回复文本推送给客服,辅助客服快速应答。

进一步地,在所述步骤S700:启动闲聊库之后,所述对话型文本分类方法还包括如下步骤:

检测当前所有客服服务器中是否存在闲聊对话;

如果当前所有客服服务器中均不存在闲聊对话,即当前的客服对话均为业务对话,则无需继续使用闲聊库,关闭所述闲聊库。

进一步地,在所述步骤S700:启动闲聊库之后,所述对话型文本分类方法还包括如下步骤:

检测当前所有客服服务器中是否存在机器人客服对话;

如果当前所有客服服务器中均不存在机器人客服对话,说明当前的客服对话都是人工客服在提供服务,即人工客服可以满足当前的客服需求,无需再继续使用闲聊库,关闭所述闲聊库。

如图3所示,进一步地,在该实施例中,所述步骤S600:如果所述对话类别为业务对话,提高所对应的对话优先级,包括如下步骤:

S610:获取所对应的对话的客户对话数据,所述对话数据可以包括该对话中前一预设时间段内客户的所有对话型文本和/或该客户在该对话之前的历史对话型文本;

S620:根据所述客户对话数据对客户进行情绪分析和/或性格分析;

对客户进行情绪分析,例如可以采用预先训练好的情绪识别机器学习模型,输入该对话前一预设时间段内客户的所有对话型文本的特征向量,得到当前客户的情绪类别,所述情绪类别例如可以包括不满、愤怒、高兴等;即对客户的情绪分析主要基于当前对话中客户的对话型文本,而不考虑在该对话之前的历史对话型文本;所述情绪识别机器学习模型例如可以采用卷积神经网络模型或者支持向量机、决策树等二分类模型,预先采用多个添加有情绪类别标签的样本文本进行训练,得到收敛的情绪识别机器学习模型;

对客户进行性格分析,例如可以采用预先训练好的性格识别机器学习模型,输入该对话中前一预设时间段内客户的所有对话型文本和/或该客户在该对话之前的历史对话型文本,得到当前客户的性格类别,所述性格类别例如可以包括激进、平稳等;对客户性格的识别可以基于其该对话中的对话型文本,也可以基于其历史所有的对话型文本,对客户进行一个更客观的综合性评估;所述性格识别机器学习模型例如可以采用卷积神经网络模型或者支持向量机、决策树等二分类模型,预先采用多个添加有性格类别标签的样本文本进行训练,得到收敛的性格识别机器学习模型;

S630:根据所述情绪分析和/或性格分析判断是否满足预设的对话优先级提高条件;

例如,预设所述对话优先级提高条件为识别到的情绪为不满或愤怒,或者预设所述对话优先级提高调解为识别到的性格为激进,或者其他的与情绪和/或性格识别结果相关的条件;此对话优先级提高条件可以根据不同的情况进行调整;

S640:如果是,则提高所对应的对话优先级,提高对话优先级的方法可以采用上述的直接转人工客服、转专业机器人客服、转更高一级人工客服、转历史评分更高的人工客服等等方式;

S650:否则,不提高所对应的对话优先级。

如图4所示,进一步地,所述步骤S700中,于所述对话持续为闲聊对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级,包括如下步骤:

S810:获取当前客服服务器的服务量数据,所述客服服务器的服务量数据包括但不限于:客服服务器的预设时间范围内的访问量、人工客服的排队数量或排队时长、当前空闲的人工客服数量、当前闲聊对话的数量、当前业务对话的数量、各种业务类型的业务对话的数量等各种数据中的一种或多种;

S820:判断当前客服服务器的服务量数据是否满足预设的降低优先级条件,例如,设定降低优先级条件包括当前客服服务器的预设时间范围内的访问量大于预设访问量阈值、人工客服的排队数量大于预设数量阈值、人工排队时长大于预设时长阈值等等;

S830:如果是,则说明当前客服服务器的工作负荷是比较大的,为了给业务对话提供更多的资源保障,需要降低该闲聊对话所对应的对话优先级,例如如前所述的转机器人客服、转通用机器人客服、降低人工客服的排队顺序等;

S840:如果否,则不降低所对应的对话优先级。

如图5所示,在该实施例中,所述对话型文本分类方法还训练所述对话型文本分类模型的步骤,具体地,采用如下步骤训练所述对话型文本分类模型:

S910:采集样本对话型文本;

S920:对所述样本对话型文本添加对话类别标签,所述对话类别标签包括业务对话标签和闲聊对话标签;

例如,一个对话型文本是“XX手机怎么样啊”,对于XX手机的店铺客服来说是业务对话,然而对于物流客服来说是闲聊对话,一个对话型文本是“物流怎么不更新啊”,对于物流客服来说是业务对话;

S930:基于所述样本对话型文本训练所述对话型文本分类模型;

在训练时,将所述样本对话型文本划分为训练数据集、验证数据集和测试数据集,然后采用训练数据集来迭代训练所述对话型文本分类模型,训练至损失函数值小于预设阈值为止,采用所述验证数据集进行模型验证,并采用所述测试数据集进行测试,在测试通过后,可以将所述对话型文本分类模型部署应用。

在该实施例中,以所述对话型文本分类模型为Liblinear二分类模型为例进行说明。如上所述,在其他可替代的实施方式中,所述对话型文本分类模型也可以是其他类别的机器学习模型。由于闲聊对话内容范围较广泛且无限,使得其数据不能完全收集到。因此,在该实施例中,基于所述样本对话型文本训练所述对话型文本分类模型时,所述业务对话的分类权重高于所述闲聊对话的分类权重,获得的对话型文本分类模型可以更好地进行闲聊识别。

如图6所示,在该实施例中,所述S911:采集样本对话型文本,包括S911:采集历史对话型文本,提取历史客户对话型文本作为所述样本对话型文本。因为不同领域的客服所遇到的客户对话型文本是不同的,不同领域的业务对话和闲聊对话的区分标准也不同。因此,针对一个特定领域的对话型文本分类模型,其样本优选是从该特定领域的历史对话型文本中获得的。

在该实施例中,为了进一步提高业务对话的识别分类的准确性,避免有业务对话错误地被认为是闲聊对话处理,而给客户带来不好的体验。在对业务对话识别后,如果对某一个业务类型的业务对话无法识别出来,进行后续回复时也无法做出很准确的业务答复。因此,在训练所述对话型文本分类模型时,需要各种业务类型的样本对话型文本都包括,且各种业务类型的样本对话型文本数量均衡。

如图6所示,所述步骤S911:提取历史客户对话型文本作为所述样本对话型文本之后,还包括如下步骤:

S912:将所述样本对话型文本分为业务对话类别和闲聊对话类别;

S913:将所述业务对话类别的样本对话型文本划分为各种业务类型的样本对话型文本,如上所述,所述业务类型可以包括寄件查询、物流时间咨询类型、物流时效投诉类型、物流服务投诉类型等等;

S914:判断各个业务类型的样本对话型文本的数量是否在预设样本数量范围内;此预设样本数量范围包括一个预设样本数量最大值和一个预设样本数量最小值,在这个最大值和最小值之间的数值范围为预设样本数量范围;

S915:如果一业务类型的样本对话型文本的数量大于预设样本数量最大值,说明该业务类型的样本对话型文本数量过多,会影响各种业务类型的样本之间的均衡,则将该业务类型中超过预设样本数量最大值的样本对话型文本剔除;

在剔除超出预设样本数量最大值的样本对话型文本时,优选将与其他样本对话文本相似度高的样本对话型文本,具体地,包括如下步骤:

将该业务类型的样本对话型文本每两个计算文本向量的相似度,将得到的相似度结果按照从大到小进行排序;

按照相似度结果排序顺序从前往后依次选择相似度结果,将选择的相似度结果中所对应的一个样本对话型文本剔除,至该业务类型中的样本对话型文本小于等于预设样本数量最大值为止;

S916:如果一业务类型的样本对话型文本的数量小于预设样本数量最小值,则说明该业务类型的样本对话型文本数量不足,对该业务类型的样本对话型文本进行扩充,至该业务类型的样本对话型文本的数量大于或等于所述预设样本数量最小值,从而保证每种业务类型都有足够的样本可以用于训练;

此处对该业务类型的样本对话型文本进行扩充,可以通过对样本对话型文本中的一些字词进行替换,例如将“快递什么时候到”替换为“快递何时到”,将“快递怎么还没有到”替换为“包裹怎么还没有到”,将替换后的文本也作为样本对话型文本;

S917:如果一业务类型的样本对话型文本的数量介于预设样本数量最大值和预设样本数量最小值之间,则该业务类型的样本对话型文本保持不变。

如图7所示,本发明实施例还提供一种对话型文本分类系统,应用于所述的对话型文本分类方法,所述系统包括:

文本获取模块M100,用于获取待分类的对话型文本,所述文本获取模块M100可以与客服服务器进行通信,或者与客服服务器的客服数据管理模块进行数据交互,在客户和客服对话过程中实时采集到对话型文本;

特征提取模块M200,用于提取所述待分类的对话型文本的待分类文本特征,所述特征提取模块M200可以通过将对话型文本进行分词,然后对每个词获取对应的词向量,将词向量组合得到待分类文本特征,也可以通过word2vec模型或卷积神经网络等特征提取模型来提取文本特征;

模型输入模块M300,用于将所述待分类文本特征输入训练好的对话型文本分类模型;

文本分类模块M400,用于获取所述对话型文本分类模型输出的对话类别,所述对话类别包括业务对话类别和闲聊对话类别;

对话处理模块M500,用于如果所述对话类别为业务对话,提高所对应的对话优先级,提高对话优先级的方式可以包括但不限于:机器客服直接转人工客服、提高人工客服的排队顺序、转接到高一级别或者历史评分高的人工客服、或者由通用机器人客服转接到专业机器人客服等等各种方式的一种或多种;以及如果所述对话类别为闲聊对话,并对所对应的对话进行计数或计时,并于所述对话的计数或计时结果达到预设阈值时,降低所对应的对话优先级,降低所对应的对话优先级可以包括但不限于:人工客服直接转机器人客服、降低人工客服的排队顺序、转接到低一级别或者历史评分低的人工客服、或者由专业机器人客服转接到通用机器人客服等等各种方式的一种或多种。

本发明的对话型文本分类系统通过文本获取模块M100、特征提取模块M200获取对话型文本并提取文本特征,通过模型输入模块M300和文本分类模块M400对对话型文本进行识别和分类,并且通过文本分类模块M400根据分类结果分别提供不同的服务模式,针对闲聊对话客户提供闲聊服务,并且在满足降优先级条件时,降低闲聊对话客户的优先级,避免过多占用客服资源,也为业务对话客户提供更充足的客服资源,针对业务对话客户,提升其对应的对话优先级,从而可以为业务对话用户提供更快、更好的业务服务。

本发明的对话型文本分类系统可以应用于各个服务领域的客服服务器,实时获取到客服对话中的待分类的对话型文本,并且可以根据对话型文本的分类类型确定后续的客服服务策略。客户通过使用手机、平板电脑、笔记本电脑等用户终端来与客服服务器来进行通信,客服分为机器人客服和人工客服,机器人客服的算法可以内置于客服服务系统或单独提供一个机器人客服服务器,人工客服通过其使用的电脑等终端与客服服务器来进行通信。即客服服务器建立了客户和客服之间的通信通道,客户和客服可以基于客服服务器进行对话。本发明的对话型文本分类系统也可以应用于一个单独的服务器,与客服服务器通信,从客服服务器实时获取到获取到客服对话中的待分类的对话型文本,并且可以根据对话型文本的分类类型确定后续的客服服务策略,如果客服服务策略相比于前一时刻有更新,则发送到客服服务器。

在该实施例中,所述对话型文本分类系统还包括模型训练模块,用于采集样本对话型文本;对所述样本对话型文本添加对话类别标签,所述对话类别标签包括业务对话标签和闲聊对话标签;以及基于所述样本对话型文本训练所述对话型文本分类模型。所述模型训练模块例如可以为Liblinear二分类模型,或者其他类型的机器学习模型。

在该实施例中,所述模型训练模块基于所述样本对话型文本训练所述对话型文本分类模型时,所述业务对话的分类权重高于所述闲聊对话的分类权重。

本发明实施例还提供一种对话型文本分类设备,包括处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的对话型文本分类方法的步骤。

所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。

下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图8所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述对话型文本分类方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示的步骤。

所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。

所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

所述对话型文本分类设备中,所述存储器中的程序被处理器执行时实现所述的对话型文本分类方法的步骤,因此,所述计算机存储介质也可以获得上述对话型文本分类方法的技术效果。

本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的对话型文本分类方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上执行时,所述程序代码用于使所述终端设备执行本说明书上述对话型文本分类方法部分中描述的根据本发明各种示例性实施方式的步骤。

参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上执行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

所述计算机存储介质中的程序被处理器执行时实现所述的对话型文本分类方法的步骤,因此,所述计算机存储介质也可以获得上述对话型文本分类方法的技术效果。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号