首页> 中国专利> 证券智能客服系统中实现回复投顾类问题的智能问答控制的方法、装置、处理器及存储介质

证券智能客服系统中实现回复投顾类问题的智能问答控制的方法、装置、处理器及存储介质

摘要

本发明涉及一种证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法,包括以下步骤:判断是否有敏感词,如果否,则判断当前场景是否满足场景问条件,如果是,则触发场景问逻辑,根据场景问中提前配置的选项呈现回复;否则,通过深度学习模型进行意图识别。若用户问题类型属于“问答型”,则基于知识图谱问答系统对问题进行规则解析。本发明还涉及一种在证券智能客服系统中实现回复投顾类问题的智能问答的装置、处理器及其存储介质。采用了本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质,大大降低人力成本的情况下显著提高了问答系统的泛化性能。

著录项

  • 公开/公告号CN115525752A

    专利类型发明专利

  • 公开/公告日2022-12-27

    原文格式PDF

  • 申请/专利权人 国泰君安证券股份有限公司;

    申请/专利号CN202211295488.6

  • 申请日2022-10-21

  • 分类号G06F16/332(2019.01);G06F16/36(2019.01);G06F40/30(2020.01);G06F16/33(2019.01);G06F16/338(2019.01);G06F16/35(2019.01);G06Q40/04(2012.01);G06Q40/06(2012.01);

  • 代理机构上海智信专利代理有限公司 31002;上海智信专利代理有限公司 31002;

  • 代理人王洁;郑暄

  • 地址 200041 上海市静安区南京西路768号国泰君安大厦20层

  • 入库时间 2023-06-19 18:14:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-13

    实质审查的生效 IPC(主分类):G06F16/332 专利申请号:2022112954886 申请日:20221021

    实质审查的生效

  • 2022-12-27

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及大数据领域,尤其涉及证券智能客服领域,具体是指一种证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质。

背景技术

证券智能客服是基于大数据、数据挖掘、机器学习、自然语言处理等技术,为证券公司和客户的沟通问题提供的高效的解决方案。好的智能客服可以精准识别客户问题,并且在0.1秒内给出客户所关心问题的答案,包括选股、诊股、业务咨询、意见反馈等等服务场景。智能客服在技术实现上有多种方案,但现有的证券智能客服大多数都基于FAQ(frequently-asked questions)即常见问题回答的逻辑,通过对用户常见问题的知识库构建,并对于问题一对一配置回答。然后FAQ系统会有一个相似问系统,用来加强其泛化性能,因为往往多个问题的回答都是相同的,所以会有一个算法来找知识库中与用户问题(大都基于文本相似度而非语义)最相似的问题。这样的FAQ可以在用户提问时,通过算法寻找知识库中最相似的问题,然后通过事先配置好的回复回答用户。在用户问题范围比较局限或者用户不能自己灵活提问的场景下,FAQ可以取得非常好的效果。

但在证券智能客服的场景下,用户往往有着五花八门的问题,就连同一句话的语序都有可能有很多情况。这导致了FAQ系统在证券智能客服场景下会遇到两个比较突出的问题:其一是知识库维护十分困难,因为对于证券的问法十分多样,配置好的知识库很难覆盖大部分客户问题,往往需要运营专家很大的人力成本来运营每天系统中无法被系统回答的问题,并且需要每日维护,这产生了巨大的人力成本;其二是泛化性能较弱,尽管FAQ系统通常会借助一个比较好的相似度算法通过寻找用户问题的相似问来最大程度提高FAQ系统的泛化性能,但毕竟相似度算法通常也只能基于文本而非语义,系统并不能真正意义上“理解”用户的问题,所以往往用户换了个问题的问法或者语序FAQ系统就没办法正常回复用户的问题了。

发明内容

本发明的目的是克服了上述现有技术的缺点,提供了一种满足回复响应速度快、语句解析能力强、适用范围较为广泛的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质。

为了实现上述目的,本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质如下:

该证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法,其主要特点是,所述的方法包括以下步骤:

(1)获取用户、会话、问题的数据,判断是否有敏感词,如果是,则根据敏感词对应的模板呈现回复;否则,继续步骤(2);

(2)判断当前场景是否满足场景问条件,如果是,则继续步骤(3);否则,继续步骤(4);

(3)触发场景问逻辑,根据场景问中提前配置的选项呈现回复;

(4)通过深度学习模型进行意图识别,若用户问题类型属于“问答型”,则继续步骤(5);若用户问题类型属于“非问答型”,则根据非问答问题对应的模板呈现回复;

(5)基于知识图谱问答系统对问题进行规则解析。

较佳地,所述的方法还包括以下步骤:

(6)判断是否满足图谱搜索要求,如果是,则继续步骤(7);否则,继续步骤(8);

(7)通过查询语句在图谱中查询,通过查询结果构建对图谱的查询,呈现回复;

(8)判断是否满足场景问,如果是,则继续步骤(3);否则,根据模板呈现回复。

较佳地,所述的步骤(5)具体包括以下步骤:

(5.1)通过训练后的分词算法进行分词;

(5.2)根据实体识别模型进行标签识别;

(5.3)进行查询构建,输出匹配结果。

较佳地,所述的步骤(5.3)具体包括以下步骤:

(5.3.1)构建最短路径;

(5.3.2)判断待查询属性与概念是否匹配,并输出匹配结果。

较佳地,所述的步骤(5)的知识图谱为利用图数据库的特性将不同的概念通过概念与概念间的关系构建的图结构。

较佳地,所述的方法还包括以下步骤:

根据分类模型识别用户问题类型,将业务类问题分派给知识库系统,将投顾类问题分派给知识图谱问答系统,若分派至知识库系统,则通过词向量算法计算问题词向量,通过相似度比对方法在知识库系统中找出最相似问题,并给出知识库中已经配置的回复;若分派至知识图谱问答系统,则继续步骤(1)。

该用于实现证券智能客服系统中的回复投顾类问题的智能问答处理控制的装置,其主要特点是,所述的装置包括:

处理器,被配置成执行计算机可执行指令;

存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

该用于实现证券智能客服系统中的回复投顾类问题的智能问答处理控制的处理器,其主要特点是,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

该计算机可读存储介质,其主要特点是,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

采用了本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质,解决了现有FAQ系统普遍存在的问题,在大大降低人力成本的情况下显著提高了问答系统的泛化性能。本发明可以有效解析并处理大部分常见的投顾类问题,并且自动给出正确的回复。它具有问题适应范围广,回复响应速度快,语句解析能力强,问法泛化效果好,回答内容精度高等优点。

附图说明

图1为本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的图谱问答系统的处理流程示意图。

图2为本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的知识图谱示意图。

图3为本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的知识图谱包含的概念关系示意图。

图4为本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的知识图谱解析流程示意图。

具体实施方式

为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。

本发明的该证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法,其中包括以下步骤:

(1)获取用户、会话、问题的数据,判断是否有敏感词,如果是,则根据敏感词对应的模板呈现回复;否则,继续步骤(2);

(2)判断当前场景是否满足场景问条件,如果是,则继续步骤(3);否则,继续步骤(4);

(3)触发场景问逻辑,根据场景问中提前配置的选项呈现回复;

(4)通过深度学习模型进行意图识别,若用户问题类型属于“问答型”,则继续步骤(5);若用户问题类型属于“非问答型”,则根据非问答问题对应的模板呈现回复;

(5)基于知识图谱问答系统对问题进行规则解析。

作为本发明的优选实施方式,所述的方法还包括以下步骤:

(6)判断是否满足图谱搜索要求,如果是,则继续步骤(7);否则,继续步骤(8);

(7)通过查询语句在图谱中查询,通过查询结果构建对图谱的查询,呈现回复;

(8)判断是否满足场景问,如果是,则继续步骤(3);否则,根据模板呈现回复。

作为本发明的优选实施方式,所述的步骤(5)具体包括以下步骤:

(5.1)通过训练后的分词算法进行分词;

(5.2)根据实体识别模型进行标签识别;

(5.3)进行查询构建,输出匹配结果。

作为本发明的优选实施方式,所述的步骤(5.3)具体包括以下步骤:

(5.3.1)构建最短路径;

(5.3.2)判断待查询属性与概念是否匹配,并输出匹配结果。

作为本发明的优选实施方式,所述的步骤(5)的知识图谱为利用图数据库的特性将不同的概念通过概念与概念间的关系构建的图结构。

作为本发明的优选实施方式,所述的方法还包括以下步骤:

根据分类模型识别用户问题类型,将业务类问题分派给知识库系统,将投顾类问题分派给知识图谱问答系统,若分派至知识库系统,则通过词向量算法计算问题词向量,通过相似度比对方法在知识库系统中找出最相似问题,并给出知识库中已经配置的回复;若分派至知识图谱问答系统,则继续步骤(1)。

本发明的该用于实现证券智能客服系统中的回复投顾类问题的智能问答处理控制的装置,其中所述的装置包括:

处理器,被配置成执行计算机可执行指令;

存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

本发明的该用于实现证券智能客服系统中的回复投顾类问题的智能问答处理控制的处理器,其中所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

本发明的该计算机可读存储介质,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现上述的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法的各个步骤。

证券智能客服系统的目标是服务用户,回复用户关于股票、基金、债券等证券相关的问题。而当下大部分券商的智能客服系统都是基于FAQ系统来构建。所以存在人力成本大和泛化性能弱这两个显著问题。本发明实现了在金融问答系统中,能够处理股票、行业板块、指数板块、概念板块、题材板块、地域板块、基金、基金经理等多种金融实体相关的投顾类问题,并对问题进行解析、推理和回复的智能问答系统。通过语义分类模型结合问答知识库和知识图谱推理的能力,针对不同类型的投顾类问题有针对的分别使用知识库和知识图谱方式进行回答。采用BERT模型,知识图谱,中文分词,语义解析,NLtoSQL等技术,实现了对于投顾类问题的解析,实体识别,语义解析,问题定位,图谱查询生成,图谱信息查询,回复内容构建等一整套问题回复流程系统,可以有效解析并处理大部分常见的投顾类问题,并且自动给出正确的回复。它具有问题适应范围广,回复响应速度快,语句解析能力强,问法泛化效果好,回答内容精度高等优点。

本发明的具体实施方式中,本发明首先基于分类模型识别用户问题类型,将业务类问题分派给知识库,将投顾类问题分派给知识图谱问答系统。

在知识库系统端,通过词向量相似度匹配算法匹配问题和知识库中问题,找到相似度最高的问题并给出配置好的回复。

在知识图谱问答系统端,首先深度学习意图识别模型来识别用户的意图,然后基于知识图谱和实体识别模型来解析用户的问题逻辑,最后通过用户的问题逻辑构建查询语句从知识库中获取用户需要的内容,组装后回复给用户。

每一个回答都是动态生成的,无需提前对问题一对一配置,只需要配置少量基础模板即可。这就解决了FAQ人力成本大的问题。其次,由于是深度学习意图模型来识别用户的意图,并且用知识图谱和实体识别模型来解析用户的问题逻辑,这就大大增强了系统的泛化性能,只要用户问题的逻辑没有改变,多样化的问题形式都会被系统识别并且给出正确回复,这就解决了FAQ泛化性能弱的问题。

本发明主要由分类模型、知识库系统和知识图谱问答系统两部分组成,下面依次介绍。

在收到用户问题后,系统用一个二分类模型分配用户的问题,只要知识图谱可以处理的问题就会被分给知识图谱问答系统处理,否则都会分配给知识库系统处理。该模型的准确率大约97.5%。

在知识库系统收到问题后,通过一个词向量算法计算问题词向量,并且用相似度比对方法在知识库中找收到问题的最相似问题,随后给出知识库中已经配置好的回复,对于一些知识图谱暂时无法解决的问题,会使用知识库的方式处理,例如“贵州茅台最近怎么样”,这类诊股问题,会有已经配置好的模板进行回复。

下面介绍基于知识图谱来回复用户问题的流程,以下统称为“图谱问答系统”。在收到用户提问后,图谱问答系统的处理流程如图1所示。

如图1所示,图谱问答系统主要流程中有几个关键流程,场景问逻辑、意图识别和基于KBQA对问题进行规则解析,下面分别详细说明。

一、场景问逻辑

场景问逻辑只有用户问到特定条件的问题才会触发,而且场景问中有提前配置好用户可能的选项。类似用户问“帮我选股票”,后台会请用户选需要股票的地域、需要股票的行业,然后给出系统的答案。这个逻辑可以帮助解决一些需要多轮会话才能回答的问题。

二、意图识别

意图识别流程用于分辨用户问题的类型属于“问答型”、“比较型”、“是否型”和“非问答型”四种类型中的哪一种。本发明中,利用了一个深度学习模型来处理此问题。模型是基于谷歌BERT预训练模型实现的,在测试集和生产环境下都取得了99%的准确率。

三、基于KGQA对问题进行规则解析

此处KGQA(Knowledge Graph Question Answering)指的是基于知识图谱的问答系统。如图2所示,此处知识图谱是指利用图数据库的特性把不同的概念通过概念与概念间的关系构建的图结构。图中展示的是股票和行业板块的关系,其中“股票”和“行业板块”都是一种概念,他们之间的关系是包含和被包含的关系,股票被包含于行业板块中,行业板块包含股票。所以通过这样的一种关系可以建立起一个只有两种概念的简单图谱。而我们建立的知识图谱包含的概念有“股票”,“行业板块”,“概念板块”,“指数板块”,“题材板块”,“地域板块”,“基金”,“基金经理”等等。其中概念之间的关系如图3所示:

显然股票和各板块之间的关系都是包含和被包含的关系,基金和股票是持有和被持有的关系,基金和基金经理是管理和被管理的关系。各概念均包含多种属性,例如股票的属性有净利润,公司名称,上市时间,董事长,收盘价等等。“贵州茅台”作为“股票”概念的一种具体值,在这里我们称呼为“实体”,类似的实体还有行业板块实体“白酒”,基金实体“易方达蓝筹精选”等等。这样一个知识图谱可以支持我们解析大部分问题。知识图谱解析流程如图4所示:

下面以“券商行业包含股票的收盘价”为例,详细描述知识图谱解析流程。

第一步是分词逻辑,通过训练后的分词算法,我们会把这个问题分为“券商|行业|包含|股票|的|收盘价”这几个词。

第二步是标签识别,其中“券商”会被识别为行业板块,“行业”会被识别为概念名称,“包含”会被识别为板块和股票之间的关系,“股票”被识别为概念名称,“的”识别为无用词,“收盘价”识别为股票概念的属性名称。由于分词和规则识别正确率不是100%,此处的标签识别如果有一些词没有被分词加规则识别的逻辑成功解析的时候,会参考实体识别模型的结果,加强标签识别的准确率。此外,由于大部分用户的问题不会是完全。

第三步是查询构建,通过最短路径以及一些概念匹配的逻辑,构建出的查询链路为:“券商”(行业板块)——“股票”(股票概念)——“收盘价”(股票概念的属性名称)。所以可以得到问题的逻辑链路是查找券商这个行业板块包含的股票,然后再通过找到的股票找这些股票的收盘价属性值。

通过这三个处理步骤后知识图谱解析逻辑结束,我们得到了示例问题的解析结果,显然图谱可以进行这样的查询。通过完整流程中的后续流程可以知道,后面会通过解析内容在图谱中查询后获取查询结果并返回给用户。

在本发明的具体实施方式中,系统部署需要一台内存64GB,CPU为16核,硬盘为500GB,系统为CentOS7的服务器。数据使用Mysql数据库存储,图数据库使用的是Nebula数据库。涉及到的二分类模型、意图识别、实体识别和相似度匹配模型开发代码使用python语言开发。其余代码使用java语言开发。具体算法逻辑,代码流程已在上文中详述,此处不再赘述。

本系统可以通过知识图谱解析问句“黄稚管理股票属于的行业”并给出回复。从另一张图展示的解析逻辑中可以得知,系统成功识别了“黄稚”“股票”和“行业”,并且给出了“基金经理”——“基金”——“股票”——“行业”的多跳链路,成功从知识图谱中查询到了结果并返回给了用户。其中行业的成交额和涨跌幅等属性属于行业的默认属性。

本系统也可以通过知识库回复“贵州茅台怎么样”的问题。在系统中涉及的二分类模型准确率达97.5%,知识图谱系统中意图识别模型准确率达99%,实体识别模型准确率达92%,实体相似度匹配模型准确率达77%,配合规则匹配,可以达到90%以上的实体匹配准确率。

本实施例的具体实现方案可以参见上述实施例中的相关说明,此处不再赘述。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

采用了本发明的证券智能客服系统中实现回复投顾类问题的智能问答处理控制的方法、装置、处理器及其计算机可读存储介质,解决了现有FAQ系统普遍存在的问题,在大大降低人力成本的情况下显著提高了问答系统的泛化性能。本发明可以有效解析并处理大部分常见的投顾类问题,并且自动给出正确的回复。它具有问题适应范围广,回复响应速度快,语句解析能力强,问法泛化效果好,回答内容精度高等优点。

在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号