首页> 中国专利> 一种基于知识蒸馏的合同智能审核方法及装置

一种基于知识蒸馏的合同智能审核方法及装置

摘要

本发明公开了一种基于知识蒸馏的合同智能审核方法及装置。其中,该方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。本发明解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

著录项

  • 公开/公告号CN113312455A

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利权人 北京鼎泰智源科技有限公司;

    申请/专利号CN202110695446.0

  • 发明设计人 高强;

    申请日2021-06-23

  • 分类号G06F16/33(20190101);G06F16/338(20190101);G06F40/20(20200101);

  • 代理机构11715 北京君莫知识产权代理事务所(普通合伙);

  • 代理人崔云鹤

  • 地址 100096 北京市海淀区清河小营西小口路27号西三旗文化科技园D座A8区二层2001

  • 入库时间 2023-06-19 12:22:51

说明书

技术领域

本发明涉及数据智能审核领域,具体而言,涉及一种基于知识蒸馏的合同智能审核方法及装置。

背景技术

随着智能化的不断发展,在当今的社会中人们利用智能化手段增加了学习、工作、生活的质量和效率,通过智能化手段可以给人们带来不同于传统处理方法的技术效果。

目前,在进行合同文本等文本数据审核的时候,通常利用合同文本中的数据与预设的规则结构数据进行审核和比对,并根据预设的规则得到比对审核结果,从而达到审查合同文本数据的目的,但是传统的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种基于知识蒸馏的合同智能审核方法及装置,以至少解决现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

根据本发明实施例的一个方面,提供了一种基于知识蒸馏的合同智能审核方法,包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。

可选的,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。

可选的,在所述将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。

可选的,所述训练所述审核模型包括:将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

根据本发明实施例的另一方面,还提供了一种基于知识蒸馏的合同智能审核装置,包括:获取模块,用于获取目标审核参数;识别模块,用于根据所述目标审核参数,识别合同文本中的待审核数据;审核模块,用于将所述待审核数据输入至审核模型中,生成审核结果;输出模块,用于将所述审核结果输出。

可选的,所述装置还包括:选择模块,用于根据所述合同文本的类型,选择所述目标审核参数。

可选的,所述装置还包括:训练模块,用于训练所述审核模型。

可选的,所述训练模块包括:训练单元,用于将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基于知识蒸馏的合同智能审核方法。

根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种基于知识蒸馏的合同智能审核方法。

在本发明实施例中,采用获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出的方式,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的流程图;

图2是根据本发明实施例的一种基于知识蒸馏的合同智能审核装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例,提供了根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

实施例一

图1是根据本发明实施例的一种基于知识蒸馏的合同智能审核方法的流程图,如图1所示,该方法包括如下步骤:

步骤S102,获取目标审核参数。

具体的,本发明实施例为了实现基于知识蒸馏的合同审核过程,首先需要获取目标审核参数,目标审核参数用于识别合同文本中的待审核数据,用于提取合同文本中的需要进行审核的内容,因此目标审核参数可以是用户预先根据不同合同文本定制的参数标准矩阵。

可选的,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。

具体的,为了根据不同合同文本选择合适的目标审核参数,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。

步骤S104,根据所述目标审核参数,识别合同文本中的待审核数据。

具体的,为了识别合同文本中的待审核数据,需要根据上述目标审核参数,来对合同文本中的语句进行识别,并将识别之后的数据内容作为待审核数据进行存储,并发送至以后需审核模型中进行分析和处理。

步骤S106,将所述待审核数据输入至审核模型中,生成审核结果。

具体的,待审核数据的输入需要根据审核模型的建立来实现,审核模型可以是根据知识蒸馏的算法和理论构建的,知识蒸馏的目的是将一个高精度且笨重的teacher转换为一个更加紧凑的student。具体思路是:提高teacher模型softmax层的temperature参数获得一个合适的soft target集合,然后对要训练的student模型,使用同样的temperature参数值匹配teacher模型的soft target集合,作为student模型总目标函数的一部分,以诱导student模型的训练,实现知识的迁移。

可选的,在所述将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。

可选的,所述训练所述审核模型包括:将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

具体的,为了将审核模型进行完善和成熟,在将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。训练审核模型需要大量的历史数据,因此需要将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

步骤S108,将所述审核结果输出。

具体的,当本发明实施例得到审核结果之后,需要将审核结果进行输出,其中,审核结果的输出可以是展示审核结果以便让用户可以针对合同文本的审核结果进行分析和利用。

通过上述实施例,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

实施例二

图2是根据本发明实施例的一种基于知识蒸馏的合同智能审核装置的结构框图,如图2所示,该装置包括:

获取模块20,用于获取目标审核参数。

具体的,本发明实施例为了实现基于知识蒸馏的合同审核过程,首先需要获取目标审核参数,目标审核参数用于识别合同文本中的待审核数据,用于提取合同文本中的需要进行审核的内容,因此目标审核参数可以是用户预先根据不同合同文本定制的参数标准矩阵。

可选的,所述装置还包括:选择模块,用于根据所述合同文本的类型,选择所述目标审核参数。

具体的,为了根据不同合同文本选择合适的目标审核参数,在所述获取目标审核参数之前,所述方法还包括:根据所述合同文本的类型,选择所述目标审核参数。

识别模块22,用于根据所述目标审核参数,识别合同文本中的待审核数据。

具体的,为了识别合同文本中的待审核数据,需要根据上述目标审核参数,来对合同文本中的语句进行识别,并将识别之后的数据内容作为待审核数据进行存储,并发送至以后需审核模型中进行分析和处理。

审核模块24,用于将所述待审核数据输入至审核模型中,生成审核结果。

具体的,待审核数据的输入需要根据审核模型的建立来实现,审核模型可以是根据知识蒸馏的算法和理论构建的,知识蒸馏的目的是将一个高精度且笨重的teacher转换为一个更加紧凑的student。具体思路是:提高teacher模型softmax层的temperature参数获得一个合适的soft target集合,然后对要训练的student模型,使用同样的temperature参数值匹配teacher模型的soft target集合,作为student模型总目标函数的一部分,以诱导student模型的训练,实现知识的迁移。

可选的,所述装置还包括:训练模块,用于训练所述审核模型。

可选的,所述训练模块包括:训练单元,用于将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

具体的,为了将审核模型进行完善和成熟,在将所述待审核数据输入至审核模型中,生成审核结果之前,所述方法还包括:训练所述审核模型。训练审核模型需要大量的历史数据,因此需要将所述待审核数据和所述审核结果作为输入和输出数据,训练所述审核模型。

输出模块26,用于将所述审核结果输出。

具体的,当本发明实施例得到审核结果之后,需要将审核结果进行输出,其中,审核结果的输出可以是展示审核结果以便让用户可以针对合同文本的审核结果进行分析和利用。

根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基于知识蒸馏的合同智能审核方法。

具体的,上述方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。

根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行一种基于知识蒸馏的合同智能审核方法。

具体的,上述方法包括:获取目标审核参数;根据所述目标审核参数,识别合同文本中的待审核数据;将所述待审核数据输入至审核模型中,生成审核结果;将所述审核结果输出。

通过上述实施例,解决了现有技术中的合同文本审核过程仅仅通过预设规则对合同文本数据进行审核,无法利用审核历史数据对文本进行智能化灵活性审核,即无法根据其他因素实时进行规则调整,以适应不同的合同文本审核情况的技术问题。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号