公开/公告号CN113836262A
专利类型发明专利
公开/公告日2021-12-24
原文格式PDF
申请/专利权人 中国科学技术大学;
申请/专利号CN202111079627.7
申请日2021-09-15
分类号G06F16/33(20190101);G06F40/284(20200101);G06F40/30(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06Q10/04(20120101);G06Q50/18(20120101);
代理机构11283 北京润平知识产权代理有限公司;
代理人董杰
地址 230026 安徽省合肥市包河区金寨路96号
入库时间 2023-06-19 13:49:36
技术领域
本发明涉及机器学习和基于法律文本分析的智慧司法领域,具体地,涉及一种多角度民事案件判决预测方法。
背景技术
法律判决预测旨在基于案件材料,自动预测判决结果。它是建设智慧法院系统的基础技术,深入研究该技术,不仅能够提升法律从业者的工作效率,而且可以为缺乏法律知识的人群提供快速优质的法律指导及援助。
目前,法律判决预测主要有以下两种类型:
1)基于刑事案件的判决预测:
刑事案件的判决预测主要分为单任务预测和多任务预测。单任务预测方法建模案件事实与法律知识之间的关系,将罪名属性、法条语义等相关法律知识与案件事实描述相结合,分别进行预测罪名、法条、刑期这三个子任务。但是,这种方法忽略了三个子任务之间的拓扑关系。在考虑到子任务之间的拓扑关系之后,一些研究利用多任务学习模型对这三个子任务进行联合建模,提高了任务之间的相关性和可解释性。
2)基于民事案件的判决预测:
民事案件的判决预测主要对原告的诉求做出准许或驳回的判决。为了更好的对民事案件进行判决预测,以及捕捉对互补案例材料之间复杂的交互作用,一些工作将判决预测形式化为法律阅读理解问题。遵循人民法官的工作准则,捕获事实、诉求和法条之间的复杂语义交互从而对离婚纠纷中的原告诉求进行最后的判决预测。除了离婚纠纷外,一些研究利用了买卖双方过去的行为信息和当前交易的文本证据等多视角信息在电子商务纠纷问题上。该多视角纠纷表征被集成到一个创新的多任务学习框架中,用于预测法律结果。
然而,上述基于民事案件的判决预测方法主要对某一特定的案由进行建模,而忽略了对现实情况中各种案由的建模研究。在实际审判过程中,存在着400多种案由,例如离婚纠纷和民间借贷纠纷。不同案由的案件性质和审判之间差别很大。另外,目前的工作主要从法官的角度基于案件事实描述对民事案件的判决预测进行研究,但忽略了从原告和被告的角度出发对整体案件进行研究。因此采用现有的方法,难以对多种民事案由进行统一建模从而预测出相应的判决结果。
发明内容
本发明的目的是提供一种多角度民事案件判决预测方法,该多角度民事案件判决预测方法从多角度出发,充分利用案件事实以及原告诉称、被告辩称之间的信息,并利用法律知识对原告的诉求进行判决预测,大大提高了预测结果的准确性。
为了实现上述目的,本发明提供了一种多角度民事案件判决预测方法,该多角度民事案件判决预测方法包括:
步骤1、获取诉称、辩称、事实、诉求、判决结果的训练数据集;
步骤2、建立法律知识库并根据原告诉称、被告辩称从中搜索G条法律知识;
步骤3、将步骤2中得到的G条法律知识与案件事实进行余弦相似度的计算并抽取前k条法律知识;
步骤4、将诉称、辩称、案件事实、诉求、法律知识分别通过长短期记忆网络获得其各自的向量表示,以将案件的诉称、辩称、事实、诉求和法律知识转换为低维的语义表达;
步骤5、将诉称和辩称分别与事实向量连接,再将其分别与诉求通过共同注意力网络获取诉称&事实以及辩称&事实向量表示;
步骤6、将k条法律知识向量分别与事实通过共同注意力网络获取知识&事实向量表示;
步骤7、根据诉称&事实、辩称&事实、知识&事实的向量表示对原告诉求进行判决预测。
优选地,在步骤1中,原告诉称
优选地,步骤2中包括依据规定的相应案由的解释和适用要点构建法律知识库,该法律知识库包含各个案由的相关法律知识;利用原告的诉称和被告的辩称分别对知识库进行搜索,得到G条法律知识。
优选地,在步骤3中,第i条法律知识的词序列表示为
将每条法律知识分别与案件事实计算余弦相似度,取余弦相似度最高的前k条法律知识,构成法律知识集合D={d
优选地,步骤4包括:
针对诉称,首先给定诉称的词序列表示
优选地,在步骤5中,诉称V
首先,获取亲和矩阵L,其中包含对应于所有连接词和请求词对的亲和分数:
将亲和矩阵按行标准行,为连接词中的每个词产生注意权重A
接着,根据请求中的每个词语计算诉称和事实的连接词的注意力:
最后,得到请求、诉称和事实的共同注意力诉称&事实向量表示:
采取同样的方式获得被告辩称和事实对诉求的共同注意力辩称&事实向量表示C
优选地,在步骤6中,将前k条法律知识分别与案件事实通过共同注意力网络如步骤5所示,获取第i条知识&事实的注意力向量表示
优选地,步骤7包括将步骤5和步骤6中获取的诉称&事实C
P=softmax(w
根据上述技术方案,本发明依次经过获取诉称、辩称、事实、诉求、判决结果的训练数据集;建立法律知识库并根据原告诉称、被告辩称从中共搜索G条法律知识;将G条法律知识与案件事实进行余弦相似度的计算并抽取前k条法律知识;将诉称、辩称、案件事实、诉求、法律知识分别通过长短期记忆网络获得其各自的向量表示;将诉称和辩称分别与事实向量连接,再将其分别与诉求通过共同注意力网络获取诉称&事实以及辩称&事实向量表示;将k条法律知识向量分别与事实通过共同注意力网络获取知识&事实向量表示;根据诉称&事实、辩称&事实、知识&事实的向量表示对原告诉求进行判决预测。由此可见,通过模拟人类法官的判案过程,根据案件原告、被告信息以及案件事实从外部知识库中抽取相关的法律知识。从多角度出发,充分利用案件事实以及原告诉称、被告辩称之间的信息,并利用法律知识对原告的诉求进行判决预测。相比于现有技术而言,极大地提高了预测结果的准确性。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是本发明提供的一种多角度民事案件判决预测方法的流程图;
图2是本发明提供的一种多角度民事案件判决预测方法的框架图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
参见图1和图2,本发明提供一种多角度民事案件判决预测方法,该多角度民事案件判决预测方法包括:
步骤1、获取诉称、辩称、事实、诉求、判决结果的训练数据集;
步骤2、建立法律知识库并根据原告诉称、被告辩称从中搜索G条法律知识;
步骤3、将步骤2中得到的G条法律知识与案件事实进行余弦相似度的计算并抽取前k条法律知识;
步骤4、将诉称、辩称、案件事实、诉求、法律知识分别通过长短期记忆网络获得其各自的向量表示,以将案件的诉称、辩称、事实、诉求和法律知识转换为低维的语义表达;
步骤5、将诉称和辩称分别与事实向量连接,再将其分别与诉求通过共同注意力网络获取诉称&事实以及辩称&事实向量表示;
步骤6、将k条法律知识向量分别与事实通过共同注意力网络获取知识&事实向量表示;
步骤7、根据诉称&事实、辩称&事实、知识&事实的向量表示对原告诉求进行判决预测。
在步骤1中,原告诉称
步骤2中,构建知识库的目的是为了更好的预测不同案由的民事案件。《民事案件案由规定》中规定有超过400个案由,这代表实际审判中有超出400种民事案件。《最高人民法院民事案件案由适用要点与请求权规范指引》中规定了相应案由的解释和适用要点。依此构建法律知识库,知识库中的法律知识包含了各个案由的相关法律知识。根据法官处理案件的逻辑,应当利用原告的诉称和被告的辩称分别对知识库进行搜索,共搜索出G条法律知识。
在步骤3中,为了更好对法律知识进行重排将其与案件更加的匹配。给定每条法律知识以及案件事实的词序列表示
将每条法律知识分别与案件事实计算余弦相似度,取余弦相似度最高的前k条法律知识,构成法律知识集合D={d
步骤4的目的是通过长短期记忆网络将案件的诉称、辩称、事实、诉求和法律知识转换为低维的语义表达。其中,
针对诉称,首先给定诉称的词序列表示
法官在审判过程中对案件事实进行认定需要将所有要件归入进行裁判。因此诉称V
首先,获取亲和矩阵L,其中包含对应于所有连接词和请求词对的亲和分数:
将亲和矩阵按行标准行,为连接词中的每个词产生注意权重A
接着,根据请求中的每个词语计算诉称和事实的连接词的注意力:
最后,得到请求、诉称和事实的共同注意力诉称&事实向量表示:
同样地,将V
在法官的审理过程,法律知识是审理过程不可缺少的要件之一。在步骤3中,我们获取了k条法律知识,这些知识一一对应着不同案件的相关案由。为了将法律知识更好的与案件事实相结合。前k条法律知识分别与案件事实通过共同注意力网络如步骤5所示,获取第i条知识&事实的注意力向量表示
步骤7包括将步骤5和步骤6中获取的诉称&事实C
P=softmax(w
通过上述技术方案,依次经过获取诉称、辩称、事实、诉求、判决结果的训练数据集;建立法律知识库并根据原告诉称、被告辩称从中共搜索G条法律知识;将G条法律知识与案件事实进行余弦相似度的计算并抽取前k条法律知识;将诉称、辩称、案件事实、诉求、法律知识分别通过长短期记忆网络获得其各自的向量表示;将诉称和辩称分别与事实向量连接,再将其分别与诉求通过共同注意力网络获取诉称&事实以及辩称&事实向量表示;将k条法律知识向量分别与事实通过共同注意力网络获取知识&事实向量表示;根据诉称&事实、辩称&事实、知识&事实的向量表示对原告诉求进行判决预测。由此可见,通过模拟人类法官的判案过程,根据案件原告、被告信息以及案件事实从外部知识库中抽取相关的法律知识。从多角度出发,充分利用案件事实以及原告诉称、被告辩称之间的信息,并利用法律知识对原告的诉求进行判决预测。相比于现有技术而言,极大地提高了预测结果的准确性。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
机译: 判决语句数据库创建方法,判决语句数据库搜索方法,语句创建方法,判决语句数据库创建设备,判决语句数据库检索设备,语句创建设备,判决语句数据库创建程序,判决语句数据库检索程序以及语句创建程序
机译: 用于对多视点图像进行编码的方法,图像多角度解码方法,用于多角度图像的编码设备,解码设备多角度图像,软件编码图像多角度和多角度解码程序图像
机译: MARKER判决设备,MARKER判决检测系统,MARKER判决检测设备,MARKER,MARKER判决方法及其程序