法律状态公告日
法律状态信息
法律状态
2022-07-29
公开
发明专利申请公布
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于逆向最优运输模型的可解释司法案例匹配方法。
背景技术
现有的司法案例匹配模型主要可以分为三类:基于专家知识的模型;基于引用网络的模型;基于文本语义的模型。
基于专家知识的模型是传统的案例匹配方法,该方法高度依赖模型设计者在司法领域的先验知识。例如,[1]提出在事故赔偿领域,一个案例可被拆解成若干要素,诸如支持索赔人、支持应诉人和中立因素等,一个案例可表示成这些要素的集合。于是,案例的匹配可以视为要素之间的匹配。
基于引用网络的模型多应用于英美法系国家,这类模型构建了一个先例引用网络(Precedent Citation Network),其中网络中的节点是法律案例,有向边表示源案例被目标案例引用的情况,即目标案例所使用的源案例的引用。[2]提出使用先例引用集之间的Jaccard相似度指数来推断两个法律案件的相似性。
基于文本语义的模型聚焦案例文本的内容,使用案例之间语义相似性来度量其匹配程度。得益于深度神经网络的蓬勃发展,基于文本语义的模型取得了超越前两类模型的性能表现。例如,[3]提出讲司法案例切分成多个段落,使用大规模预训练语言模型编码每个文本段落,再使用最大池化和循环神经网络建模两个案例中每个段落对的语义相似性,最后使用注意力机制输出案例正例的匹配得分。
现有的基于三元组深度哈希学习的相似司法案例匹配方法是通过获取待匹配的司法案例文书,将待匹配的司法案例文书输入到预训练的特征提取模型中,得到待匹配司法案例文书的特征表示向量,之后将待匹配司法案例文书的特征表示向量,同时输入到预训练的三元组深度哈希学习模型中,得到待匹配司法案例文书的哈希码,最后基于待匹配司法案例文书的哈希码与已知司法案例文书的哈希码,计算司法案例文书的相似度的。
现有的案例匹配模型在匹配精度上取得了较为优异的表现,但是这些模型难以为其匹配预测提供解释。造成这一现象的原因有三:其一,司法案例文档内容复杂,其中仅有部分反映司法要素的句子与匹配结果和匹配解释相关,现有模型并没有在句子层面区分司法要素和噪声;其二,案例中的司法要素可以分成支持匹配、支持不匹配两类,模型最终预测的解释应当权衡这两类司法要素,而现有模型并没有做出区分;其三,司法案例文档篇幅冗长,关于司法要素的标注存在稀疏、有偏等问题,直接拟合法要素的标签学习的模型容易陷入局部最优,限制模型的泛化性。
发明内容
为此,本发明首先提出一种基于逆向最优运输模型的可解释司法案例匹配方法,由三个模块构成:
司法要素提取模块针对输入的案例对,以两个案例(X,Y)、案例中每个句子司法要素标签r
候选解释生成模块以所述司法要素提取模块提取的两个案例的司法要素
匹配模块以所述司法要素提取模块预测的
所述最优运输过程首先对于司法案例匹配的场景中,对于任意两个案例μ、v分别视为一个均匀分布,即
其中
之后,采用逆向最优运输试图从
s.t.A
其中KL表示句子对齐标签
C=C
其中C
在训练过程中,司法要素提取模块学习代价矩阵C中的参数;在测试过程,司法要素提取模块根据C进行正向最优运输,根据最优运输方案确定案例中句子的对齐情况,并提取司法要素标签预测
所述司法要素提取模块,作为最小化模型预测的和人工标注的句子级别对齐程度之间的损失
其中,
其中δ(r,k)=1如果r=k否则为0;
所述候选解释生成模块最小化模型生成的和人工标注的自然语言解释之间的差异,损失函数
所述匹配模块最小化模型预测的和人工标注的案例匹配标签之间的差异
其中
所述训练过程具体为:基于训练数据集
对于所述司法要素提取模块的训练,重复如下过程:从训练数据集
所述候选解释生成模块的训练,重复如下过程:从训练数据集
所述匹配预测模块的训练,重复如下过程:从训练数据集
本发明所要实现的技术效果在于:
首先从案例中提取支持匹配和支持不匹配的司法要素(句子);其次根据提取的司法要素生成自然语言形式的、特定标签的解释,对应支持匹配标签和支持不匹配标签的解释;最后基于司法要素和自然语言解释输出案例对的匹配预测以及对应的解释。本发明以此为模型预测提供两个方面的解释并提升模型预测的准确率。
附图说明
图1基于逆向最优运输的可解释性案例匹配方法架构图;
具体实施方式
以下是本发明的优选实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于此实施例。
本发明提出了一种基于逆向最优运输模型的可解释司法案例匹配方法。
本方法主要由三个模块构成,分别是司法要素提取模块、候选解释生成模块和匹配模块。
司法要素提取模块负责从输入的司法案例对中提取支持匹配和支持不匹配的司法要素(句子);候选解释生成模块根据已提取的司法要素生成候选解释,即为每个潜在的匹配标签生成自然语言形式的解释;匹配模块基于提取的司法要素和生成的候选解释计算案例最终的匹配标签并输出对应的候选解释作为匹配预测的最终解释。
司法要素提取模块以两个案例(X,Y)、案例中每个句子司法要素标签r
最优运输过程定义了两个概率分布距离的距离。在司法案例匹配的场景中,两个案例可分别视为一个均匀分布即
其中
在最优运输过程中,代价矩阵常常是事先定义好的,如两个句子向量的余弦相似度等衡量两个句子语义层面的相似程度。然而,在司法案例匹配场景中两个句子对齐与否的依据超越了语义相似度的范畴。模型不仅仅需要考虑语义,更要考虑句子是否体现为某种司法要素,诸如案情事实、要件事实或是争议焦点。同时考虑到
不同于给定代价矩阵C求解运输方案A
s.t.A
其中KL表示句子对齐标签
C=C
其中C
候选解释生成模块以司法要素提取模块提取的两个案例的司法要素
匹配模块以司法要素提取模块预测的
本方法包含三个子模块,每个模块包含各自的训练目标:司法要素提取模块最小化模型预测的和人工标注的句子级别对齐程度之间的损失
司法要素提取模块的损失函数
其中,
其中δ(r,k)=1如果r=k否则为0;
候选解释生成模块的损失函数
匹配模块的损失函数
其中
本方法的训练流程:
要求:训练数据集
1
2:repeat:
3:从训练数据集
4:预测(X
5:计算
6:构造C,C
7:计算
8:计算
9:梯度更新
10:until收敛
11:return
13:
14:repeat:
15:从训练数据集
16:微调三个标签特定的预训练语言模型
17:until收敛
18:return
19:
20:repeat:
21:从训练数据集
22:使用
23:计算
24:计算
25:梯度更新
26:until收敛
27:return
综上,基于逆向最优运输的可解释性案例匹配方法以训练集
本技术方案是一个模型框架,不同司法要素提取模块、候选解释生成模块和匹配预测模块的配置会有不同的具体实现。本节介绍一种应用于本模型的样例实现。
1司法要素提取模块
给定两个输入司法案例X,Y,本样例首先使用在大规模司法案例语料库中预训练的BERT模型[4]把输入案例中的所有句子映射成固定长度的句嵌入向量,具体来说使用BERT模型在“[CLS]”字符上的输出作为整个句子的嵌入,记为
2候选解释生成模块
给定两个输入司法案例X,Y、句子级别司法要素标签的预测
3.匹配模块
本样例的匹配模块以表示司发要素的句子
机译: 基于移动通信终端的呼叫中断信息的最优收益设备及其控制方法,一种包括该设备的系统,该系统能够考虑移动通信终端的用户模式来实现最优收益
机译: 使用一种或多种遗传和表观遗传标记提供遗传测试服务的方法及其用于源自一种或多种模型物种的一种或多种遗传和表观遗传标记的靶物种,基于不同物种之间的匹配
机译: 基于数据驱动模型的能源建模方法,最优能源管理与控制方法和系统