首页> 中国专利> 基于弱监督学习的信息识别方法及相关设备

基于弱监督学习的信息识别方法及相关设备

摘要

本发明涉及人工智能技术领域,提供一种基于弱监督学习的信息识别方法,包括:获取政务场景中的多个常见问题解答FAQ数据,并基于多个FAQ数据,构建第一标签数据集;使用第一卷积神经网络CNN,对第一标签数据集进行多标签文本分类,获得多标签CNN模型;获取多个第二标签数据集,并使用多个第二标签数据集对多标签CNN模型进行调整,获得最终多标签分类器;接收输入的用户问题;将用户问题输入至最终多标签分类器中,获得与用户问题匹配的多个政务实体;输出多个政务实体。本发明还涉及区块链技术,可以将多个政务实体上传至区块链上。本发明能应用在智慧政务、智慧社区等需要进行信息识别的领域,从而推动智慧城市的发展。

著录项

  • 公开/公告号CN112507095A

    专利类型发明专利

  • 公开/公告日2021-03-16

    原文格式PDF

  • 申请/专利号CN202011481937.7

  • 发明设计人 谢攀;

    申请日2020-12-15

  • 分类号G06F16/332(20190101);G06F16/35(20190101);G06F40/279(20200101);G06Q50/26(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44334 深圳市赛恩倍吉知识产权代理有限公司;

  • 代理人迟珊珊

  • 地址 518000 广东省深圳市前海深港合作区妈湾兴海大道3048号前海自贸大厦1-34层

  • 入库时间 2023-06-19 10:16:30

说明书

技术领域

本发明涉及人工智能技术领域,尤其涉及一种基于弱监督学习的信息识别方法及相关设备。

背景技术

目前,在政务场景中,经常会遇到各种各样的咨询问题,需要提供答案,政务问答机器人在问答方面起着很关键的作用。政务问答机器人可以协助政府人员解答用户的咨询问题,咨询问题通常对应着相关的政务实体,例如:个体工商户信息注册、居住证办理、农药广告审批、知识产权维权资助、种禽生产经营许可证核发等。

然而,实际中发现,政务实体一般都比较专业化,而不同的用户又有不同的口语化叫法;另外,政务实体信息隐含在用户表达的咨询问题中,很难准确提取政务实体,这使得用户的体验较差。

因此,如何在政务场景中,对政务实体进行有效识别是一个亟待解决的技术问题。

发明内容

鉴于以上内容,有必要提供一种基于弱监督学习的信息识别方法及相关设备,能够在政务场景中,对政务实体进行有效识别。

本发明的第一方面提供一种基于弱监督学习的信息识别方法,所述基于弱监督学习的信息识别方法包括:

获取政务场景中的多个常见问题解答FAQ数据,并基于多个所述FAQ数据,构建第一标签数据集;

使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,其中,所述第一CNN中的全链接层对应N个激活函数,所述N与输出的标签序列的维数相同,所述多标签CNN模型为弱监督的模型;

获取多个第二标签数据集,并使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器;

接收输入的用户问题;

将所述用户问题输入至所述最终多标签分类器中,获得与所述用户问题匹配的多个政务实体;

输出所述多个政务实体。

在一种可能的实现方式中,所述基于多个所述FAQ数据,构建第一标签数据集包括:

通过汉语语言模型Ngram,扫描多个所述FAQ数据中的答案数据;

根据词向量模型,将所述答案数据转换成第一向量,以及根据所述词向量模型,将政务实体库中的政务实体转换成第二向量;

将所述第一向量与所述第二向量进行余弦相似度计算,获得相似度分值;

将所述相似度分值大于预设阈值的政务实体确定为所述FAQ数据匹配的标签;

根据每个所述FAQ数据以及所述FAQ数据匹配的标签,构建第一标签数据集。

在一种可能的实现方式中,所述第一标签数据集中,每个问题对应一个标签列表,所述标签列表中的每个标签对应一个政务实体,所述标签列表中,与所述问题匹配的政务实体的标签被设置为第一标识,与所述问题不匹配的政务实体的标签被设置为第二标识。

在一种可能的实现方式中,所述使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型包括:

使用第一卷积神经网络CNN,采用N个sigmoid激活函数对所述第一标签数据集中的每个标签进行二分类训练;

计算每个维度的所述标签的损失函数,并计算所有维度上标签的平均损失函数;

将所述平均损失函数确定为所述第一标签数据集的第一损失函数;

调整所述第一CNN的模型参数,以最小化所述第一损失函数,获得多标签CNN模型。

在一种可能的实现方式中,所述使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器包括:

获取所述多标签CNN模型的历史模型参数;

采用所述多个第二标签数据集对所述多标签CNN模型的历史模型参数进行迭代训练,并计算第二损失函数,其中,所述第二损失函数为所有维度上标签的平均损失函数;

调整所述历史模型参数,以最小化所述第二损失函数,获得最终多标签分类器。

在一种可能的实现方式中,所述输出所述多个政务实体包括:

获取当前用户的历史咨询领域;

计算每个所述政务实体与所述历史咨询领域的第一匹配度;

获取每个所述政务实体与所述用户问题的第二匹配度;

对所述第一匹配度和所述第二匹配度进行加权,获得每个所述政务实体的加权值;

根据加权值从高到低的顺序,输出所述多个政务实体。

在一种可能的实现方式中,所述基于弱监督学习的信息识别方法还包括:

判断在预设时间内是否接收到当前用户针对所述多个政务实体的选择指令;

若在预设时间内未接收到当前用户针对所述多个政务实体的选择指令,获取当前用户的历史问答记录;

从所述历史问答记录中,确定所述当前用户的咨询领域;

从所述多个政务实体中筛选出与所述咨询领域匹配的目标政务实体;

输出所述目标政务实体的详细内容。

本发明的第二方面提供一种信息识别装置,所述信息识别装置包括:

获取模块,用于获取政务场景中的多个常见问题解答FAQ数据,并基于多个所述FAQ数据,构建第一标签数据集;

分类模块,用于使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,其中,所述第一CNN中的全链接层对应N个激活函数,所述N与输出的标签序列的维数相同,所述多标签CNN模型为弱监督的模型;

所述获取模块,还用于获取多个第二标签数据集;

调整模块,用于使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器;

接收模块,用于接收输入的用户问题;

输入模块,用于将所述用户问题输入至所述最终多标签分类器中,获得与所述用户问题匹配的多个政务实体;

输出模块,用于输出所述多个政务实体。

本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于弱监督学习的信息识别方法。

本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于弱监督学习的信息识别方法。

由以上技术方案可知,本发明可应用在智慧政务、智慧社区等需要进行信息识别的领域,从而推动智慧城市的发展。本发明中,通过构建第一标签数据集,将政务实体识别任务转化为多标签分类任务,利用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,并使用多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器,即实现了从弱监督学习到精准调整的模型训练优化过程,大大减少了人工标注的工作量,同时,也提高了模型训练的效率以及模型对政务实体识别的准确度。

附图说明

图1是本发明公开的一种基于弱监督学习的信息识别方法的较佳实施例的流程图。

图2是本发明公开的一种信息识别装置的较佳实施例的功能模块图。

图3是本发明实现基于弱监督学习的信息识别方法的较佳实施例的电子设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

其中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、嵌入式设备等。所述电子设备还可包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理PDA等。

请参见图1,图1是本发明公开的一种基于弱监督学习的信息识别方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。

S11、获取政务场景中的多个常见问题解答FAQ数据,并基于多个所述FAQ数据,构建第一标签数据集。

其中,FAQ是英文Frequently Asked Questions的缩写,中文意思为“经常问到的问题”,或者更通俗地叫做“常见问题解答”。

其中,政务场景中通常有大量的FAQ数据,这类数据主要有几个来源,1、政务客服人员的常见问题库,2、用户的真实问题。这类数据有如下特点:1、无人工标注;2、问题表述多样化,口语化,而答案一般是专业人员给出的,表述相对标准化,专业化;3、一般会针对一个具体的政务实体。

其中,第一标签数据集即弱监督的标签数据集。

其中,政务实体比如个体工商户信息注册、居住证办理、农药广告审批、知识产权维权资助、种禽生产经营许可证核发等。

具体的,所述基于多个所述FAQ数据,构建第一标签数据集包括:

通过汉语语言模型Ngram,扫描多个所述FAQ数据中的答案数据;

根据词向量模型,将所述答案数据转换成第一向量,以及根据所述词向量模型,将政务实体库中的政务实体转换成第二向量;

将所述第一向量与所述第二向量进行余弦相似度计算,获得相似度分值;

将所述相似度分值大于预设阈值的政务实体确定为所述FAQ数据匹配的标签;

根据每个所述FAQ数据以及所述FAQ数据匹配的标签,构建第一标签数据集。

其中,N-Gram是大词汇连续语音识别中常用的一种语言模型,称为汉语语言模型(CLM,Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,可以实现到汉字的自动转换。

其中,词向量模型比如Word2vec,Word2vec是一群用来产生词向量的相关模型。word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

其中,所述第一标签数据集中,每个问题对应一个标签列表,所述标签列表中的每个标签对应一个政务实体,所述标签列表中,与所述问题匹配的政务实体的标签被设置为第一标识,与所述问题不匹配的政务实体的标签被设置为第二标识。

具体的,举例来说,标签列表可以由值为1(即第一标识)或0(即第二标识)的数字组成,标签列表的长度即政务实体的数量。其中,值为1的标签对应的政务实体为匹配的政务实体,值为0的标签对应的政务实体为不匹配的政务实体。

S12、使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,其中,所述第一CNN中的全链接层对应N个激活函数,所述N与输出的标签序列的维数相同,所述多标签CNN模型为弱监督的模型。

其中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)。传统的CNN的结构:(卷积层+非线性激活函数(Relu或tanh)+池化层)×n+多个全连接层。

本发明中,第一CNN是将传统的CNN中的最后的全链接层设置为对应的标签长度,并对其中的每一维添加一个sigmoid激活函数,共记N个sigmoid激活函数,每一个sigmoid激活函数对应着标签列表中的一维。

具体的,所述使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型包括:

使用第一卷积神经网络CNN,采用N个sigmoid激活函数对所述第一标签数据集中的每个标签进行二分类训练;

计算每个维度的所述标签的损失函数,并计算所有维度上标签的平均损失函数;

将所述平均损失函数确定为所述第一标签数据集的第一损失函数;

调整所述第一CNN的模型参数,以最小化所述第一损失函数,获得多标签CNN模型。

其中,使用第一卷积神经网络CNN对第一标签数据集进行训练,可以获得弱监督模型,即多标签CNN模型,该多标签CNN模型属于一个弱监督的多标签分类器,能够对政务实体(即政务实体)作出粗略的识别,为了进一步提高识别的准确度,还需要对多标签CNN模型做进一步的训练优化。

S13、获取多个第二标签数据集,并使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器。

其中,每个所述第二标签数据集均是由人工标注的准确的问答数据的集合,即每个问题都配置有精准的政务实体以及标签。

具体的,所述使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器包括:

获取所述多标签CNN模型的历史模型参数;

采用所述多个第二标签数据集对所述多标签CNN模型的历史模型参数进行迭代训练,并计算第二损失函数,其中,所述第二损失函数为所有维度上标签的平均损失函数;

调整所述历史模型参数,以最小化所述第二损失函数,获得最终多标签分类器。

其中,通过人工标注的多个第二标签数据集对所述多标签CNN模型进行调整,可以优化所述多标签CNN模型的历史模型参数,获得更加精准的模型参数,从而使得迭代训练后的最终多标签分类器的识别精度更高,识别效果更好。

S14、接收输入的用户问题。

其中,用户问题即政务问题。

S15、将所述用户问题输入至所述最终多标签分类器中,获得与所述用户问题匹配的多个政务实体。

其中,该多个政务实体即当前用户想咨询的可能的政务实体。

S16、输出所述多个政务实体。

具体的,所述输出所述多个政务实体包括:

获取当前用户的历史咨询领域;

计算每个所述政务实体与所述历史咨询领域的第一匹配度;

获取每个所述政务实体与所述用户问题的第二匹配度;

对所述第一匹配度和所述第二匹配度进行加权,获得每个所述政务实体的加权值;

根据加权值从高到低的顺序,输出所述多个政务实体。

在该可选的实施方式中,同一个用户,咨询的领域通常是固定的,可以将每个政务实体以及历史咨询领域进行分词和句向量的转换操作,获得向量之后,在进行余弦相似度计算,即可获得第一匹配度。其中,政务实体和历史咨询领域转换成向量属于现有技术,不进行详细描述。

可以预先设置第一匹配度和所述第二匹配度的权重,根据权重来计算每个政务实体的加权值,该加权值可以用来衡量政务实体与用户问题的符合程度的高低。根据加权值的大小来输出多个政务实体,可以让当前用户更直观地优先看到符合自己意图的政务实体,而不需要一个一个去查找,从而可以提高用户的咨询满意度。

可选的,所述方法还包括:

判断在预设时间内是否接收到当前用户针对所述多个政务实体的选择指令;

若在预设时间内未接收到当前用户针对所述多个政务实体的选择指令,获取当前用户的历史问答记录;

从所述历史问答记录中,确定所述当前用户的咨询领域;

从所述多个政务实体中筛选出与所述咨询领域匹配的目标政务实体;

输出所述目标政务实体的详细内容。

在该可选的实施方式中,当输出多个可能的政务实体时,当前用户由于个人专业水平限制,很难进行选择,在这种情况下,可以基于历史的问答记录来确定用户经常提问的问题所属的咨询领域,进而可以缩小范围,筛选出与所述咨询领域匹配的目标政务实体,从而能够为当前用户提供更加精准的服务,提高用户的咨询满意度。

可选的,所述方法还包括:

将所述多个政务实体上传至区块链。

其中,为了确保数据的私密性和安全性,可以将所述多个政务实体上传至区块链进行保存。

在图1所描述的方法流程中,通过构建第一标签数据集,将政务实体识别任务转化为多标签分类任务,利用改进型的卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,并使用人工标注的多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器,即实现了从弱监督学习到精准调整的模型训练优化过程,大大减少了人工标注的工作量,同时,也提高了模型训练的效率以及模型对政务实体识别的准确度。

由以上实施例可知,本申请可应用在智慧政务、智慧社区等需要进行信息识别的领域,从而推动智慧城市的发展。以上所述,仅是本发明的具体实施方式,但本发明的保护范围并不局限于此,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。

请参见图2,图2是本发明公开的一种信息识别装置的较佳实施例的功能模块图。

在一些实施例中,所述信息识别装置运行于电子设备中。所述信息识别装置可以包括多个由程序代码段所组成的功能模块。所述信息识别装置中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行图1所描述的基于弱监督学习的信息识别方法方法中的部分或全部步骤。

本实施例中,所述信息识别装置根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、分类模块202、调整模块203、接收模块204、输入模块205及输出模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。

获取模块201,用于获取政务场景中的多个常见问题解答FAQ数据,并基于多个所述FAQ数据,构建第一标签数据集。

其中,FAQ是英文Frequently Asked Questions的缩写,中文意思为“经常问到的问题”,或者更通俗地叫做“常见问题解答”。

其中,政务场景中通常有大量的FAQ数据,这类数据主要有几个来源,1、政务客服人员的常见问题库,2、用户的真实问题。这类数据有如下特点:1、无人工标注;2、问题表述多样化,口语化,而答案一般是专业人员给出的,表述相对标准化,专业化;3、一般会针对一个具体的政务实体。

其中,政务实体即政务实体,比如个体工商户信息注册、居住证办理、农药广告审批、知识产权维权资助、种禽生产经营许可证核发等。

具体的,所述基于多个所述FAQ数据,构建第一标签数据集包括:

通过汉语语言模型Ngram,扫描多个所述FAQ数据中的答案数据;

根据词向量模型,将所述答案数据转换成第一向量,以及根据所述词向量模型,将政务实体库中的政务实体转换成第二向量;

将所述第一向量与所述第二向量进行余弦相似度计算,获得相似度分值;

将所述相似度分值大于预设阈值的政务实体确定为所述FAQ数据匹配的标签;

根据每个所述FAQ数据以及所述FAQ数据匹配的标签,构建第一标签数据集。

其中,N-Gram是大词汇连续语音识别中常用的一种语言模型,称为汉语语言模型(CLM,Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息,可以实现到汉字的自动转换。

其中,词向量模型比如Word2vec,Word2vec是一群用来产生词向量的相关模型。word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

其中,所述第一标签数据集中,每个问题对应一个标签列表,所述标签列表中的每个标签对应一个政务实体,所述标签列表中,与所述问题匹配的政务实体的标签被设置为第一标识,与所述问题不匹配的政务实体的标签被设置为第二标识。

具体的,举例来说,标签列表可以由值为1(即第一标识)或0(即第二标识)的数字组成,标签列表的长度即政务实体的数量。其中,值为1的标签对应的政务实体为匹配的政务实体,值为0的标签对应的政务实体为不匹配的政务实体。

分类模块202,用于使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,其中,所述第一CNN中的全链接层对应N个激活函数,所述N与输出的标签序列的维数相同,所述多标签CNN模型为弱监督的模型。

其中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)。传统的CNN的结构:(卷积层+非线性激活函数(Relu或tanh)+池化层)×n+多个全连接层。

本发明中,第一CNN是将传统的CNN中的最后的全链接层设置为对应的标签长度,并对其中的每一维添加一个sigmoid激活函数,共记N个sigmoid激活函数,每一个sigmoid激活函数对应着标签列表中的一维。

具体的,所述使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型包括:

使用第一卷积神经网络CNN,采用N个sigmoid激活函数对所述第一标签数据集中的每个标签进行二分类训练;

计算每个维度的所述标签的损失函数,并计算所有维度上标签的平均损失函数;

将所述平均损失函数确定为所述第一标签数据集的第一损失函数;

调整所述第一CNN的模型参数,以最小化所述第一损失函数,获得多标签CNN模型。

其中,使用第一卷积神经网络CNN对第一标签数据集进行训练,可以获得弱监督模型,即多标签CNN模型,该多标签CNN模型属于一个弱监督的多标签分类器,能够对政务实体(即政务实体)作出粗略的识别,为了进一步提高识别的准确度,还需要对多标签CNN模型做进一步的训练优化。

所述获取模块201,还用于获取多个第二标签数据集。

调整模块203,用于使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器。

其中,每个所述第二标签数据集均是由人工标注的准确的问答数据的集合,即每个问题都配置有精准的政务实体以及标签。

具体的,所述使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器包括:

获取所述多标签CNN模型的历史模型参数;

采用所述多个第二标签数据集对所述多标签CNN模型的历史模型参数进行迭代训练,并计算第二损失函数,其中,所述第二损失函数为所有维度上标签的平均损失函数;

调整所述历史模型参数,以最小化所述第二损失函数,获得最终多标签分类器。

其中,通过人工标注的多个第二标签数据集对所述多标签CNN模型进行调整,可以优化所述多标签CNN模型的历史模型参数,获得更加精准的模型参数,从而使得迭代训练后的最终多标签分类器的识别精度更高,识别效果更好。

接收模块204,用于接收输入的用户问题。

其中,用户问题即政务问题。

输入模块205,用于将所述用户问题输入至所述最终多标签分类器中,获得与所述用户问题匹配的多个政务实体。

其中,该多个政务实体即当前用户想咨询的可能的政务实体。

输出模块206,用于输出所述多个政务实体。

具体的,所述输出所述多个政务实体包括:

获取当前用户的历史咨询领域;

计算每个所述政务实体与所述历史咨询领域的第一匹配度;

获取每个所述政务实体与所述用户问题的第二匹配度;

对所述第一匹配度和所述第二匹配度进行加权,获得每个所述政务实体的加权值;

根据加权值从高到低的顺序,输出所述多个政务实体。

在该可选的实施方式中,同一个用户,咨询的领域通常是固定的,可以将每个政务实体以及历史咨询领域进行分词和句向量的转换操作,获得向量之后,在进行余弦相似度计算,即可获得第一匹配度。可以预先设置第一匹配度和所述第二匹配度的权重,根据权重来计算每个政务实体的加权值,该加权值可以用来衡量政务实体与用户问题的符合程度的高低。根据加权值的大小来输出多个政务实体,可以让当前用户更直观地优先看到符合自己意图的政务实体,而不需要一个一个去查找,从而可以提高用户的咨询满意度。

可选的,所述信息识别装置还包括:

判断模块,用于判断在预设时间内是否接收到当前用户针对所述多个政务实体的选择指令;

所述获取模块201,还用于若在预设时间内未接收到当前用户针对所述多个政务实体的选择指令,获取当前用户的历史问答记录;

确定模块,用于从所述历史问答记录中,确定所述当前用户的咨询领域;

筛选模块,用于从所述多个政务实体中筛选出与所述咨询领域匹配的目标政务实体;

所述输出模块206,用于输出所述目标政务实体的详细内容。

在该可选的实施方式中,当输出多个可能的政务实体时,当前用户由于个人专业水平限制,很难进行选择,在这种情况下,可以基于历史的问答记录来确定用户经常提问的问题所属的咨询领域,进而可以缩小范围,筛选出与所述咨询领域匹配的目标政务实体,从而能够为当前用户提供更加精准的服务,提高用户的咨询满意度。

在图2所描述的信息识别装置中,通过构建第一标签数据集,将政务实体识别任务转化为多标签分类任务,利用改进型的卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,并使用人工标注的多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器,即实现了从弱监督学习到精准调整的模型训练优化过程,大大减少了人工标注的工作量,同时,也提高了模型训练的效率以及模型对政务实体识别的准确度。

如图3所示,图3是本发明实现基于弱监督学习的信息识别方法的较佳实施例的电子设备的结构示意图。所述电子设备3包括存储器31、至少一个处理器32、存储在所述存储器31中并可在所述至少一个处理器32上运行的计算机程序33及至少一条通讯总线34。

本领域技术人员可以理解,图3所示的示意图仅仅是所述电子设备3的示例,并不构成对所述电子设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备3还可以包括输入输出设备、网络接入设备等。

所述至少一个处理器32可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。该处理器32可以是微处理器或者该处理器32也可以是任何常规的处理器等,所述处理器32是所述电子设备3的控制中心,利用各种接口和线路连接整个电子设备3的各个部分。

所述存储器31可用于存储所述计算机程序33和/或模块/单元,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块/单元,以及调用存储在存储器31内的数据,实现所述电子设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备3的使用所创建的数据(比如音频数据)等。此外,存储器31可以包括非易失性和易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。

结合图1,所述电子设备3中的所述存储器31存储多个指令以实现一种基于弱监督学习的信息识别方法,所述处理器32可执行所述多个指令从而实现:

获取政务场景中的多个常见问题解答FAQ数据,并基于多个所述FAQ数据,构建第一标签数据集;

使用第一卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,其中,所述第一CNN中的全链接层对应N个激活函数,所述N与输出的标签序列的维数相同,所述多标签CNN模型为弱监督的模型;

获取多个第二标签数据集,并使用所述多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器;

接收输入的用户问题;

将所述用户问题输入至所述最终多标签分类器中,获得与所述用户问题匹配的多个政务实体;

输出所述多个政务实体。

具体地,所述处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

在图3所描述的电子设备3中,通过构建第一标签数据集,将政务实体识别任务转化为多标签分类任务,利用改进型的卷积神经网络CNN,对所述第一标签数据集进行多标签文本分类,获得多标签CNN模型,并使用人工标注的多个第二标签数据集对所述多标签CNN模型进行调整,获得最终多标签分类器,即实现了从弱监督学习到精准调整的模型训练优化过程,大大减少了人工标注的工作量,同时,也提高了模型训练的效率以及模型对政务实体识别的准确度。

所述电子设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。本发明中陈述的多个单元或装置也可以通过软件或者硬件来实现。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号