首页> 中国专利> 法院观点信息结构化的方法、装置、存储介质和电子设备

法院观点信息结构化的方法、装置、存储介质和电子设备

摘要

本申请公开了一种法院观点信息结构化的方法、装置、存储介质和电子设备等,所述方法根据法院观点信息的特定特征,对法院观点信息中的各类子信息进行分别抓取,并将各类子信息进行关联形成结构化信息,以实现按照一类或者多类子信息对法院观点信息进行数据统计和分析,从而构建裁判文书知识库,为基于法院观点信息实现的不同维度司法大数据应用服务提供知识数据支撑。

著录项

  • 公开/公告号CN112559669A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 鼎富智能科技有限公司;

    申请/专利号CN202011426815.8

  • 发明设计人 刘大双;张志一;

    申请日2020-12-09

  • 分类号G06F16/31(20190101);G06F16/9535(20190101);G06Q50/18(20120101);

  • 代理机构11363 北京弘权知识产权代理事务所(普通合伙);

  • 代理人郭放;许伟群

  • 地址 230000 安徽省合肥市高新区习友路3333号A1楼19层-B区

  • 入库时间 2023-06-19 10:24:22

说明书

技术领域

本申请属于数据信息处理领域,特别涉及一种法院观点信息结构化的方法、装置、存储介质和电子设备。

背景技术

目前,法院观点信息全部以文本形式保存,并且一般内容繁长,如果对法院观点信息进行提取,则需要人工阅读大量文本文件,并逐一提取有效信息。由于法院观点信息量大,难以快速由海量信息中提取目标信息,因此,人工处理不仅效率低下,对于时间紧急的任务难以完成,而且,人工操作难免存在疏漏,造成重要信息的丢失。

基于现有技术,对法院观点信息进行提取或者分析非常不便。

发明内容

为解决上述问题,本申请提供一种法院观点信息结构化的方法,所述方法根据法院观点信息的特定特征,对法院观点信息中的各类子信息进行分别抓取,并将各类子信息进行关联形成结构化信息,以实现按照一类或者多类子信息对法院观点信息进行数据统计和分析,从而构建裁判文书知识库,为基于法院观点信息实现的不同维度司法大数据应用服务提供知识数据支撑。

本申请的目的在于提供以下几个方面:

第一方面,本申请提供一种法院观点信息结构化的方法,所述方法包括:

获取法院观点文本信息,所述法院观点文本信息包括个性化信息和至少一个审判观点信息;

对所述法院观点文本信息进行切块,获得个性化信息和审判观点信息;

利用信息抽取模型抽取每个审判观点信息中的审判要素,根据所述审判要素生成至少一个结构化审判观点信息;

利用信息抽取模型抽取法院观点文本信息中的法律引用信息,生成结构化法律引用信息;

将所述个性化信息与结构化审判观点信息以及法律引用信息进行封装,生成结构化法院观点信息。

在一种可实现的方式中,所述对所述法院观点文本信息进行切块可以包括:

根据所述切块标记字符将所述法院观点文本信息切割成多个信息块;

对每块所述信息块进行信息清洗,获得个性化子信息和审判观点信息;

汇集各个所述个性化子信息,获得个性化信息。

在另一种可实现的方式中,所述对所述法院观点文本信息进行切块可以包括:

对所述法院观点文本信息进行信息清洗,获得个性化信息和审判观点信息组;

根据切块标记字符将所述审判观点信息组切割成至少一个审判观点信息。

在一种可实现的方式中,所述利用信息抽取模型抽取每个审判观点信息中的所有审判要素,根据所述审判要素生成至少一个结构化审判观点信息可以包括:

根据信息抽取模型中每个审判要素抽取节点获得审判要素文本;

对每个审判观点信息中各审判要素抽取节点与所述审判要素文本相对应,生成审判要素;

对各审判要素进行关联处理,生成结构化审判观点信息。

在第一种实现方式中,所述根据信息抽取模型中每个审判要素抽取节点获得审判要素文本具体包括:

根据信息抽取模型中每个审判要素抽取节点确定每个审判观点信息中的审判要素节点字符,所述审判要素抽取节点为与所述审判观点信息中各审判要素具有对应关系的字符串,所述审判要素节点字符为所述审判观点信息中与所述审判要素抽取节点相对应审判要素内容的起始字符;

根据所述审判要素节点字符确定每个审判要素节点对应的审判要素文本,所述审判要素文本为从当前审判要素节点字符起至下一个审判要素节点字符之间的全部字符。

在第二种实现方式中,所述根据信息抽取模型中每个审判要素抽取节点获得审判要素文本具体包括:使用抽取表达式从审判观点信息文本中直接抽取审判要素文本。

在一种可实现的方式中,所述对各审判要素进行关联处理,生成结构化审判观点信息可以包括:

根据每个审判观点信息中的审判要素生成审判要素列表,所述审判要素列表包括原告请求结果集、被告抗辩结果集和审判结果集;

根据审判结果集中审判结果的顺序,依次对原告请求结果集中的原告请求和/或被告请求结果集中的被告请求以及相应的审判结果相互关联,生成结构化审判观点信息。

可选地,根据每个审判观点信息中的审判要素生成审判要素列表可以包括:

抽取审判要素生成审判观点信息候选集合;

对所述审判观点信息候选集合进行去冗余处理,生成审判观点信息集合;

对所述审判观点信息集合进行封装,生成审判要素列表。

在一种可实现的方式中,利用信息抽取模型抽取每个审判观点信息中的法律引用信息,生成一个法律引用信息列表可以包括:

根据信息抽取模型中法律引用抽取节点确定每个审判观点信息中的法律引用节点字符,所述法律抽取节点为与所述审判观点信息中所引用法律条款具有对应关系的字符串,所述法律引用节点字符为所述审判观点信息中与法律引用抽取节点相对应法律条款内容的起始字符;

根据所述法律引用节点字符确定每个法律引用节点对应的法律引用信息,所述法律引用信息为从当前法律引用节点字符起至下一个法律引用节点字符之间的全部字符;

获取每个法律引用信息的位置索引;

根据所述法律引用信息以及其对应的位置索引生成法律引用信息列表。

在一种可实现的方式中,所述将所述个性化信息与结构化审判观点信息以及法律引用信息进行封装可以包括:

根据原告请求的位置索引对结构化审判观点信息进行升序或者降序排列;

获取第一位置索引和第二位置索引,其中,第一位置索引为当前原告请求的位置索引,所述第二位置索引为下一条原告请求的位置索引;

关联被告抗辩信息,所关联被告抗辩信息的位置索引位于第一位置索引与第二位置索引之间;

关联原告请求法律依据信息,所关联原告请求法律依据信息的位置索引位于第一位置索引与被告抗辩信息的位置索引之间;

关联被告抗辩法律依据信息,所述被告抗辩法律依据信息的位置索引位于被告抗辩信息的位置索引与所述第二位置索引之间。

第二方面,本申请还提供一种法院观点信息结构化的装置,所述装置包括:

文本信息获取单元,用于获取法院观点文本信息,所述法院观点文本信息包括个性化信息和至少一个审判观点信息;

文本信息切块单元,用于对所述法院观点文本信息进行切块,获得个性化信息和审判观点信息;

结构化审判观点信息生成单元,用于利用信息抽取模型抽取每个审判观点信息中的审判要素,根据所述审判要素生成至少一个结构化审判观点信息;

结构化法律引用信息生成单元,还用于利用信息抽取模型抽取法院观点文本信息中的法律引用信息,生成结构化法律引用信息;

结构化法院观点信息生成单元,用于将所述个性化信息与结构化审判观点信息以及结构化法律引用信息进行封装,生成结构化法院观点信息。

在一种可实现的方式中,所述文本信息切块单元可以包括:

信息块切割子单元,用于根据所述切块标记字符将所述法院观点文本信息切割成多个信息块;

信息块清洗子单元,用于对每块所述信息块进行信息清洗,获得个性化子信息和审判观点信息;

个性化信息生成子单元,用于汇集各个所述个性化子信息,获得个性化信息。

在另一种可实现的方式中,所述文本信息切块单元可以包括:

信息块清洗子单元,还用于对所述法院观点文本信息进行信息清洗,获得个性化信息和审判观点信息组;

审判观点信息生成子单元,用于根据切块标记字符将所述审判观点信息组切割成至少一个审判观点信息。

在一种可实现的方式中,所述结构化审判观点信息生成单元可以包括:

文本信息抽取子单元,用于根据信息抽取模型中每个审判要素抽取节点获得审判要素文本;

文本对应子单元,用于对每个审判观点信息中各审判要素抽取节点与所述审判要素文本相对应,生成审判要素;

结构化信息生成子单元,用于对各审判要素进行关联处理,生成结构化审判观点信息。

在第一种实现方式中,所述文本信息抽取子单元具体包括:

节点字符确定模块,用于根据信息抽取模型中每个审判要素抽取节点确定每个审判观点信息中的审判要素节点字符,所述审判要素抽取节点为与所述审判观点信息中各审判要素具有对应关系的字符串,所述审判要素节点字符为所述审判观点信息中与所述审判要素抽取节点相对应审判要素内容的起始字符;

文本信息提取模块,用于根据所述审判要素节点字符确定每个审判要素节点对应的审判要素文本,所述审判要素文本为从当前审判要素节点字符起至下一个审判要素节点字符之间的全部字符。

在第二种实现方式中,所述文本信息抽取子单元具体包括:

文本信息提取模块,还用于使用抽取表达式从审判观点信息文本中直接抽取审判要素文本。

在一种可实现的方式中,所述结构化信息生成子单元可以包括:

审判要素列表生成模块,用于根据每个审判观点信息中的审判要素生成审判要素列表,所述审判要素列表包括原告请求结果集、被告抗辩结果集和审判结果集;

结构化信息生成模块,还用于根据审判结果集中审判结果的顺序,依次对原告请求结果集中的原告请求和/或被告请求结果集中的被告请求以及相应的审判结果相互关联,生成结构化审判观点信息。

可选地,所述审判要素列表生成模块可以包括:

候选集合生成子模块,用于抽取审判要素生成审判观点信息候选集合;

冗余去除子模块,用于对所述审判观点信息候选集合进行去冗余处理,生成审判观点信息集合;

信息集合封装子模块,用于对所述审判观点信息集合进行封装,生成审判要素列表。

在一种可实现的方式中,结构化法律引用信息生成单元可以包括:

节点字符确定子单元,用于根据信息抽取模型中法律引用抽取节点确定每个审判观点信息中的法律引用节点字符,所述法律抽取节点为与所述审判观点信息中所引用法律条款具有对应关系的字符串,所述法律引用节点字符为所述审判观点信息中与法律引用抽取节点相对应法律条款内容的起始字符;

文本信息提取子单元,用于根据所述法律引用节点字符确定每个法律引用节点对应的法律引用信息,所述法律引用信息为从当前法律引用节点字符起至下一个法律引用节点字符之间的全部字符;

位置索引获取子单元,用于获取每个法律引用信息的位置索引;

结构化信息生成子单元,还用于根据所述法律引用信息以及其对应的位置索引生成结构化法律引用信息。

在一种可实现的方式中,结构化法院观点信息生成单元可以包括:

信息排序子单元,用于根据原告请求的位置索引对结构化审判观点信息进行升序或者降序排列;

位置索引获取子单元,还用于获取第一位置索引和第二位置索引,其中,第一位置索引为当前原告请求的位置索引,所述第二位置索引为下一条原告请求的位置索引;

信息关联子单元,用于关联被告抗辩信息,所关联被告抗辩信息的位置索引位于第一位置索引与第二位置索引之间;

信息关联子单元,还用于关联原告请求法律依据信息,所关联原告请求法律依据信息的位置索引位于第一位置索引与被告抗辩信息的位置索引之间;

信息关联子单元,还用于关联被告抗辩法律依据信息,所述被告抗辩法律依据信息的位置索引位于被告抗辩信息的位置索引与所述第二位置索引之间。

第三方面,本申请还提供一种法院观点信息结构化的计算机程序产品,所用计算机程序产品在计算机上运行时,用于执行时实现上述第一方面所述法院观点信息结构化方法的步骤。

第四方面,一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述第一方面所述法院观点信息结构化方法的步骤。

第五方面,一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述第一方面所述法院观点信息结构化的方法。

与现有技术相比,本申请提供的方法能够根据法院观点信息的特定特征,对法院观点信息中的各类子信息进行分别抓取,并将各类子信息进行关联形成结构化信息,以实现按照一类或者多类子信息对法院观点信息进行数据统计和分析,从而构建裁判文书知识库,为基于法院观点信息实现的不同维度司法大数据应用服务提供知识数据支撑,提高信息处理效率和准确度,降低重要信息丢失的可能。

附图说明

图1示出本申请所提供法院观点信息结构化方法的流程图;

图2示出本申请实施例提供的一种法院信息结构化装置200的结构框图;

图3示出本申请实施例提供的一种电子设备300的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致方法的例子。

下面通过具体的实施例对本申请提供的法院观点信息结构化的方法及装置进行详细阐述。

首先,对本方案的使用场景作简要介绍。

法院观点信息,特别是民事一审信息一般包括是否到庭信息、争辩焦点信息、原告主张信息、被告抗辩信息、审判结果信息和引用法律信息等,而对于其它类型的法院观点信息,例如,民事二审信息、刑事一审信息等,具有其它形式和内容的特征信息,因此,本申请提供的方案特别适用于对民事一审审判观点信息的处理。

在本申请中,法院观点信息结构化为对法院观点文本信息进行结构化处理,获得法院观点的结构化信息,所述结构化信息是指信息经过分析后分解成多个互相关联的组成部分,各组成部分间有明确的层次结构。在本申请中,法院观点结构化信息系指从法院观点信息文档中提取出来的文本,文本中各级标题及隶属于标题的文本内容具有明确的层次结构。结构化信息后续可以通过html、word或者txt等多种格式的文件展现出来。

结构化存储是指把需要结构化的多个文件的内容按树形结构保存到一个文件中去,从而获得结构化信息,以便于按json格式对信息进行分类、提取和处理。在本申请中,结构化存储每一个所述标题及隶属于所述标题的文本内容,是指将各级标题,以及隶属于各级标题的内容,按照树形结构和层次进行存储,从而获得法院观点的结构化信息,为实现不同维度司法大数据应用服务提供知识数据支撑,提高信息处理效率和准确度,降低重要信息丢失的可能。

以下示出几个法院观点信息示例:

(1)本院认为,合法的借贷关系和合法的担保关系应受法律保护。被告A公司作为借款人在授信期限和金额内向原告借款400万元,并签订《借款合同》,属双方真实意思表示,故该合同真实有效,对双方产生法律拘束力。原告依约将400万元借款转至被告A公司的账户,履行了合同义务,被告A公司未依约还款付息是引发本案纠纷的根本原因,应承担违约责任,故原告要求被告A公司偿还借款本金360万元及支付利息的请求,本院予以支持。依据法律规定,双方约定的逾期利率及违约金不得超过年利率24%,故本案借贷双方约定的逾期未偿还借款的逾期利率和违约金按月利率2%计算,其余部分不予支持。法律规定利率计算的最高限为月2%,因原告已经主张利息按15‰的月利率计算,故应支持的违约金部分的利率应为二者的差额5‰,因此本案借款的违约金应以360万元为基数,按月利率5‰自2015年12月1日至2016年5月1日计算为90000元。原告要求被告支付其为实现债权所支出的律师费的诉讼请求符合双方合同约定,故本院予以支持。被告池某华、郑某思、郑某华及被告B公司分别与原告签订《保证合同》,表示四被告同意为本案借款提供连带责任保证担保,故原告要求四被告对该借款本息承担连带清偿责任的请求,本院予以支持。被告郑某思称其不清楚本案借款过程及金额,故不应承担担保责任,被告郑某思作为完全民事行为能力人,应对其在保证合同上签字的行为负法律责任,其辩解意见本院不予采信。被告池某毕、池某华分别与原告签订《最高额抵押合同》,将被告池某毕名下位于三明市三元区XXXX幢XXXX室及被告池某华名下位于三明市三元区XXXX7幢XXXX室的房产为本案借款提供抵押,并办理了抵押登记,表示二被告同意以该二处房产为本案借款提供抵押担保,故原告要求对该抵押房产享有优先受偿权的请求,本院予以支持。被告A公司、池某毕、池某华、郑某华、B公司经本院合法传唤拒不到庭参加诉讼,视为其自愿放弃诉讼权利,本院依法缺席进行审理和判决。据此,依照《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条、《中华人民共和国合同法》第一百九十六条、第一百九十七条、第一百九十八条、《中华人民共和国担保法》第十八条、第三十一条和《中华人民共和国民事诉讼法》第一百四十四条的规定,判决如下:

(2)本院认为,本案的争议焦点为:被告张某源是否应当偿还原告借款1000万元及利息和违约金以及被告C公司是否应当承担责任。

1、关于借款是否成立以及是否应当归还的问题。……据此,依照《中华人民共和国合同法》第七十九条、第八十条、第一百零七条、第一百九十六条,《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条,《中华人民共和国担保法》第十八条、第二十一条、第三十一条和《最高人民法院关于民事诉讼证据的若干规定》第二条之规定,判决如下:

(3)本院认为,首先需要确定的是本案是否超过诉讼时效。《中华人民共和国民法总则》第一百八十八条第二款规定,诉讼时效期间自权利人知道或者应当知道权利受到损害以及义务人之日起计算。法律另有规定的,依照其规定。但是自权利受到损害之日起超过二十年的,人民法院不予保护;有特殊情况的,人民法院可以根据权利人的申请决定延长。本案所涉债权的初始债权人为P办事处,债务人为沧州市M一厂,担保人为沧州市N厂,借款期间自1992年6月5日至1992年10月5日,沧州市M一厂未在协议约定期间偿还贷款,作为债权人的P办事处在1992年10月5日应当已知其权利受到损害,则该笔债权20年最长权利保护期限最后截止日为2012年10月5日。秦某文自2017年8月10日通过与Q公司签订债权转让协议取得本案所涉债权,此时,该笔债权请求权已超过法律规定的20年最长权利保护期限,且原告未提交证据证明债权人存在因客观障碍导致其在法定期间不能行使请求权从而延长权利保护期限的情形。根据《最高人民法院关于审理民事案件适用诉讼时效制度若干问题的规定》第二十一条的规定,主债务诉讼时效期间届满,保证人享有主债务人的诉讼时效抗辩权,被告沧州市N厂现提出诉讼时效抗辩,符合法律规定,抗辩理由成立,本院予以支持。综上所述,依照《中华人民共和国民法总则》第一百八十八条、第一百九十二条、《最高人民法院关于贯彻执行<中华人民共和国民法通则>若干问题的意见》第169条、第175条、《最高人民法院关于审理民事案件适用诉讼时效制度若干问题的规定》第二十一条的规定,判决如下:

为了便于理解本申请实施例,首先在此对本申请实施例中的一些术语进行解释如下:

“判决书”是指法院根据判决写成的文书。其中,判决书可包括法院名称、案件类型、案号、当事人信息、审理经过、一审请求情况、一审答辩情况、本院查明、本院认为、裁判结果、审判人员、裁判日期、书记员和附录等。

“法院观点信息”对应于判决书中的记载法院观点的信息,具体地,如前述示例(1)~示例(3)。

在本申请中,法院观点信息可以包括争议焦点信息、审判观点信息和个性化信息。

“争议焦点信息”是指在法院观点信息中,对本案原被告双方争议的焦点问题进行总结归纳所得内容。具体如示例(2)中“本案的争议焦点为:被告张某源是否应当偿还原告借款1000万元及利息和违约金以及被告C公司是否应当承担责任”。

“审判观点信息”是指法院观点信息中关于审判观点的内容,每个审判观点信息中包括至少一个审判要素,所述审判要素为做出审判决定的参考因素,例如未到庭信息、原告主张信息、被告抗辩信息、审判结果信息和引用法律信息等。

“未到庭信息”是指法院观点信息中,用于确定被告未到庭,视为放弃抗辩权利的信息内容,具体如示例(1)中“被告A公司、池某毕、池某华、郑某华、B公司经本院合法传唤拒不到庭参加诉讼,视为其自愿放弃诉讼权利,本院依法缺席进行审理和判决”。

“原告主张信息”是指原告所主张的内容,具体地,如示例(1)中“原告要求被告A公司偿还借款本金360万元及支付利息的请求”。

“被告抗辩信息”是指被告针对原告各项主张进行抗辩的内容,具体地,如示例(3)中“被告沧州市N厂现提出诉讼时效抗辩”。

“审判结果信息”是指表述法院对每一项原告主张或者被告抗辩所提出的明确的总结性审判意见的语句。本申请提供的方案将审判意见归纳为四种类型,以便进行信息结构化与关联分析,具体包括“全部支持”、“全部不支持”、部分支持“”和“不予处理”。

可以理解的是,对于单项审判目标或者审判对象,审判结果可能是“全部支持”、“全部不支持”、“部分支持”或者“不予处理”中的任意一种。在本申请中,对于同时存在两类审判目标或者对象,如果法院针对其中的一方的审判结果为“全部支持”,则默认法院对另一方的审判意见为“全部不支持”;对于同类审判目标或者对象,如果存在两种不同类的审判意见,则默认审判意见为“部分支持”,具体地,如示例(1)中的“予以支持”和“不予采纳”。

“引用法律信息”是指针对每一项原告请求以及被告抗辩,法院做出审判意见所依据和引用的法律条款。具体地,如示例(3)中“《中华人民共和国民法总则》第一百八十八条第二款”和“《最高人民法院关于审理民事案件适用诉讼时效制度若干问题的规定》第二十一条”。

“个性化信息信息”是指法院观点信息中,在总结判决结果前,对引用法律法规内容总结、归纳性的信息内容,具体如示例(1)中“据此,依照《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条、《中华人民共和国合同法》第一百九十六条、第一百九十七条、第一百九十八条、《中华人民共和国担保法》第十八条、第三十一条和《中华人民共和国民事诉讼法》第一百四十四条的规定,判决如下:”。

“切块标记”是指用于对法院观点信息进行信息切块的特征字符,用于逐项识别并提取审判观点信息结束位置,并以此分割法院观点中的多项审判观点信息,通常,每项审判观点信息以审判结果信息结束,因此,在本申请中,所述“切块标记”可以采用审判结果信息中常用的结束字符,具体如示例(1)中“本院予以支持”。

在本申请所提供的方法中,所述“逻辑模块”为虚拟模块,具有识别并提取特定文本内容以及所述特定文本内容所对应的位置索引等信息的功能,甚至包括将所提取的多个特定文本建立逻辑关联。例如,“民事一审判决书目录结构化逻辑模块”可以由民事一审判决书中提取法院观点目录以及各目录对应的文本,并根据所提取的法院观点目录以及目录中各标题对应的文本生成目录结构化的判决文书。

本申请所提供方法的主要思路为首先对采集到的法院观点信息进行处理获得至少一项审判观点信息,根据所获得的审判观点信息块生成审判信息列表,所述审判信息列表中记录有审判观点信息内容及其位置索引,进一步地,根据位置索引与信息分类对所述审判信息列表对各审判观点信息以及法律引用信息进行关联,从而生成结构化的法院观点信息,其中,所述审判观点信息可以通过两种方式获取,一是先对法院观点信息进行清洗再按照审判结果进行切块,获得各项审判观点信息,二是先将法院观点信息按照审判结果信息进行切块,再对每块信息块进行清洗而获得各项审判观点信息。

本申请提供的方法能够基于法院观点数据实现不同维度司法大数据应用服务,提供知识数据支撑。

图1示出本申请所提供法院观点信息结构化方法的流程图,可以理解的是,图1所示的方法可以由法院观点信息结构化装置执行,所述装置可以与下文中图2所示的装置对应,所述装置可以是能够执行该方法的各种设备,例如,如个人计算机、服务器或网络设备等,本申请实施例并不限于此,如图1所示,本申请提供的方法具体可以包括以下步骤S101至步骤S105:

步骤S101,获取法院观点文本信息,所述法院观点文本信息包括个性化信息和至少一个审判观点信息。

在本实例中,所述法院观点文本信息可以为一个自然段,也可以为多个自然段,以“本院认为”作为起始,以“判决如下:”作为截止。

在本申请中,所述法院观点文本信息可以为利用预设模块预先由判决书中截取而得,也可以通过其它方法而获得。

例如,可以利用一审判决书目录结构化逻辑模块处理民事一审判决书,提取法院观点目录以及该目录中各标题对应的文本内容,生成目录结构化的判决书,进一步地,从所述结构化的判决书中获取目录标题为“本院认为”的文本块内容,该文本块内容即为本步骤中所述法院观点文本信息。

步骤S102,对所述法院观点文本信息进行切块,获得个性化信息和审判观点信息。

本实例首先对法院观点文本信息进行切块处理,每块所得信息块中包括至多一条审判观点信息,和/或包括至多一条个性化信息或者争议焦点信息,除去个性化信息以及争议焦点信息后,每块信息块中仅包括一条审判观点信息,因此,切块所得信息块可为后续处理提供基础。

在本实例中,所述切块标记可以为审判结果信息中结束字符,例如“本院予以支持”或者“本院不予支持”等,也可以根据所述争议焦点信息而确定,本申请人发现,根据所述争议焦点而确定的切块标记能够提高对审判观点信息切块的精准度。

进一步地,可以利用基于位置索引是否包含的策略,识别并筛选精确的切块标记,其中,本实例设定多个抽取规则对法院观点文本信息进行切块,因此,会产生多个切块结果,这些切块结果之间可能存在包含关系,这些被包含的结果可以认为是冗余结果,本申请采用基于位置索引是否包含的策略来消除这些冗余结果,具体地,比对所有抽取结果,首先比较各抽取结果之间起始位置索引的大小(索引小表示位置靠前),再比较两个抽取结果的文本内容长度,来判断两个抽取结果是否为包含关系,例如,起始位置索引小,而文本内容长度大,并且,两起始位置索引之差小于文本内容长度之差,则认为存在包含关系。

所述争议焦点信息可以利用信息抽取模型(例如,本体树)由法院观点信息中抽取。

本实例对争议焦点信息进行结构化的方法不做特别限定。

在本实例中,本步骤包括至少以下两种具体处理方式:一是首先对法院观点文本信息进行切块,再对每块切块所得的信息块进行数据清洗;二是首先对法院观点文本信息进行清洗,再对清洗后的法院观点文本信息进行切块处理。

本申请人发现,任意一种处理方式均能够分离个性化信息以及审判观点信息。

具体地,在第一种方式中,步骤S102可以包括以下子步骤S121至子步骤S123:

子步骤S121,根据所述切块标记字符将所述法院观点文本信息切割成多个信息块。

在本实例中,可以使用切块标记对所述法院观点文本信息进行切块处理。

利用所述切块标记将所述法院观点文本信息切割成多个信息块,每块信息块包括审判观点信息和/或个性化子信息。

在本实例中,所述个性化子信息为通过切块操作被分散于各个信息块中的个性化信息条目,所有所述个性化子信息合并后即形成个性化信息。

具体地,可以预先编辑第一抽取表达式,再利用预设的信息抽取模型将第一抽取表达式与所述法院观点文本信息进行匹配,从而将所述法院观点文本信息进行切块。

其中,所述第一抽取表达式包括第一关键词,在本实例中,所述第一关键词即为所述切块标记,可以理解的是,所述第一关键词可以根据实际需求而具体设定,本申请对其并无特别限定。例如,针对民事一审判决书中的法院观点文本信息,所述第一关键词,或者说切块标记可以设定为“本院予以支持”,或者“本院不予支持”等。

相应地,本实例以下的表述中,其它关键词与第一关键词类似,具体可以参见第一关键词的相关描述,后续不再一一赘述。

进一步地,所述第一抽取表达式中还可以包括其它信息,例如,还可以包括通配符等符号。

相应地,在本实例以下的表述中,其它抽取表达式与所述第一抽取表达式类似,具体可参见第一抽取表达式的相关描述,后续不再一一赘述。

更进一步地,在本实例中,所述第一抽取表达式可根据正则表达式的语法结合业务知识来具体设定,例如,所述第一抽取表达式可以为@([本我]院|本案)[^,,。;;认]{0,}?予([^。;]*[。;;][^,,。;;]*((?<!(保证人|担保人).{2,5})责任后|[^,,。;;]*[赔付还计算])[^。;;]*(?<!(予责任).{0,5})。|[^。;;]*((?<!返还|保护)(;|;|。(?!因此|该))))@;或者@(仅|(?<!予[^,,。;;]{0,5})部分|难以|无法|不能).{0,2}支持[^,,。;;]{0,}?[。;;]@等。

子步骤S122,对每块所述信息块进行信息清洗,获得个性化子信息和审判观点信息。

在本步骤中,所述信息清洗具体为将每块信息块中的审判观点信息以及个性化子信息进行分离,并将分离所得审判观点信息与个性化子信息分别缓存于不同的列表中,例如,所述审判观点信息缓存于审判观点信息列表,而个性化子信息缓存于个性化信息列表。

在本步骤中,信息列表包括信息文本内容以及所述信息文本内容所对应的位置索引,例如,所述审判观点信息列表包括审判观点信息文本内容以及所述审判观点信息文本内容所对应的位置索引,再如,个性化信息列表包括个性化信息文本内容以及所述个性化信息文本内容所对应的位置索引。

在本实例的以下表述中,其它信息列表所包括的内容与审判信息列表类似,具体可参见审判信息列表,不再一一赘述。

在本步骤中,可以采用第二抽取表达式对各信息块逐块进行信息清洗,其中,所述第二抽取表达式可以为:k_。{0,0}@([^。]{0,20}?[依根][照据]).{0,5}?《[^,。;;]*?》[^。]*?判决如(.|\n)*@,或者c_起始符号{0,0}@(.|\n)*(认定.{0,5}事实|上述事实.{0,}?佐证).*\n@{0,2}k_本院认为。

子步骤S123,汇集各个所述个性化子信息,获得个性化信息。

在本实例中,将步骤S122从各个信息块中分离得到的个性化子信息合并,形成一条完整的个性化信息。

以下以法院观点信息示例(1)说明按照第一种方式实现步骤S102的方式:

在本示例中,所述法院观点信息未包括争议焦点信息,包括个性化信息以及审查观点信息,其中,所述审判观点信息具体包括未到庭信息、原告主张信息、被告抗辩信息和审判结果信息等子信息,相应地,设置有未到庭信息列表、原告主张信息列表、被告抗辩信息列表和审判结果信息列表,信息列表用于存储每条信息的文本内容以及所述文本内容对应的位置索引。

在本示例中,所述切块标记可以为“予以支持”以及“不予支持”,则可将所述法院观点文本信息切割成六块信息块,其中,第一信息块为“本院认为,合法的借贷关系和合法的担保关系应受法律保护。被告A公司作为借款人在授信期限和金额内向原告借款400万元,并签订《借款合同》,属双方真实意思表示,故该合同真实有效,对双方产生法律拘束力。原告依约将400万元借款转至被告A公司的账户,履行了合同义务,被告A公司未依约还款付息是引发本案纠纷的根本原因,应承担违约责任,故原告要求被告A公司偿还借款本金360万元及支付利息的请求,本院予以支持。”;第二信息块为“依据法律规定,双方约定的逾期利率及违约金不得超过年利率24%,故本案借贷双方约定的逾期未偿还借款的逾期利率和违约金按月利率2%计算,其余部分不予支持。”;第三信息块为“法律规定利率计算的最高限为月2%,因原告已经主张利息按15‰的月利率计算,故应支持的违约金部分的利率应为二者的差额5‰,因此本案借款的违约金应以360万元为基数,按月利率5‰自2015年12月1日至2016年5月1日计算为90000元。原告要求被告支付其为实现债权所支出的律师费的诉讼请求符合双方合同约定,故本院予以支持。”;第四信息块为“被告池某华、郑某思、郑某华及被告B公司分别与原告签订《保证合同》,表示四被告同意为本案借款提供连带责任保证担保,故原告要求四被告对该借款本息承担连带清偿责任的请求,本院予以支持。”;第五信息块为“被告郑某思称其不清楚本案借款过程及金额,故不应承担担保责任,被告郑某思作为完全民事行为能力人,应对其在保证合同上签字的行为负法律责任,其辩解意见本院不予采信。被告池某毕、池某华分别与原告签订《最高额抵押合同》,将被告池某毕名下位于三明市三元区XXXX幢XXXX室及被告池某华名下位于三明市三元区XXXX7幢XXXX室的房产为本案借款提供抵押,并办理了抵押登记,表示二被告同意以该二处房产为本案借款提供抵押担保,故原告要求对该抵押房产享有优先受偿权的请求,本院予以支持。”;第六信息块为“被告A公司、池某毕、池某华、郑某华、B公司经本院合法传唤拒不到庭参加诉讼,视为其自愿放弃诉讼权利,本院依法缺席进行审理和判决。据此,依照《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条、《中华人民共和国合同法》第一百九十六条、第一百九十七条、第一百九十八条、《中华人民共和国担保法》第十八条、第三十一条和《中华人民共和国民事诉讼法》第一百四十四条的规定,判决如下:”。

进一步地,对各信息块进行清洗,即,抽取各信息块中的争议焦点信息以及个性化子信息,具体于本示例,各信息块中均未体现争议焦点信息,而在第六信息块中存在个性化子信息“据此,依照《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条、《中华人民共和国合同法》第一百九十六条、第一百九十七条、第一百九十八条、《中华人民共和国担保法》第十八条、第三十一条和《中华人民共和国民事诉讼法》第一百四十四条的规定,判决如下:”,因此,抽取该个性化子信息的文本内容及其对应的位置索引,并将所述文本内容以及位置索引存储于个性化信息列表中。

在第二种方式中,步骤S102可以包括以下子步骤S121’至子步骤S122’:

子步骤S121’,对所述法院观点文本信息进行信息清洗,获得个性化信息和审判观点信息组。

在本步骤中,可以首先对法院观点文本信息进行信息清洗,抽取各个性化子信息及其对应的位置索引并依次缓存于个性化信息列表中,汇合成一条个性化信息。

本申请人发现,首先对法院观点文本信息进行信息清洗便于后续切块定位。

子步骤S122’,根据切块标记字符将所述审判观点信息组切割成至少一个审判观点信息。

本步骤与步骤S121相似,具体实现方式可以参见步骤S121,在此不再赘述。

可以理解的是,采用第二种方式与采用第一种方式对法院观点信息进行切块,所得信息块是相同的。

步骤S103,利用信息抽取模型抽取每个审判观点信息中的所有审判要素,根据所述审判要素生成至少一个结构化审判观点信息。

在本实例中,本步骤可以包括以下步骤S131至步骤S133:

步骤S131,根据信息抽取模型中每个审判要素抽取节点获得审判要素文本。

在本实例中,所述抽取节点可以包括抽取名称和抽取表达式,所述抽取表达式可用于抽取特定内容的文本,具体地,以本体树为例,抽取节点可以为本体树上的节点。

进一步地,所述审判要素抽取节点为处理所述审判观点信息中与各审判要素具有对应关系字符串的逻辑点,具体可以包括审判要素名称和用于抽取所述审判要素节点字符的抽取表达式。例如,审判要素抽取节点的名称可以为“未到庭”、“原告主张”等。

在本实例中,本步骤至少包括以下两种实现方式:一是首先确定审判要素节点字符,再根据审判信息节点字符确定各审判要素文本;二是利用多个抽取表达式直接由审判观点信息中抽取各个审判要素抽取节点所对应的审判要素文本。

在第一种实现方式中,本步骤包括以下步骤S1311和步骤S1312:

步骤S1311,根据信息抽取模型中每个审判要素抽取节点确定每个审判观点信息中的审判要素节点字符。

在本实例中,所述审判要素节点字符为所述审判观点信息中与所述审判要素抽取节点相对应审判要素内容的起始字符,例如,对于“原告主张”节点,所述审判要素节点字符可以为“原告要求”。

步骤S1312,根据所述审判要素节点字符确定每个审判要素节点对应的审判要素文本,所述审判要素文本为从当前审判要素节点字符起至下一个审判要素节点字符之间的全部字符。

对于第二种实现方式,本步骤使用抽取表达式从审判观点信息文本中直接抽取,各个抽取表达式可灵活利用正则表达式的语法结合业务知识来具体设定。

例如,对于原告主张信息可以设定如下抽取表达式:@(被告|公司)[^,。;,;辩驳]*((?<!(不|被告))应(?!.{0,3}[当由知应的视效自])|(?<!及)([尚结仍])欠|约定了))[^。,,;;()]*([,,]并)?[^。,,;;()]{0,}@,所述抽取表达式解读为以下1)点至5)点:

1)(被告|公司)表示文本中包含“被告”或者“公司”关键词;

2)[^,。;,;辩驳]*表示在文本中匹配到被告或者公司的位置,向后匹配任一非断句符号,包括“,。;,;”,同时不能出现表示被告辩驳的概念,即不能出现包含“辩”或者“驳”字符,如辩解、抗辩、辩驳、反驳等关键词;

3)(?<!(不|被告))应(?!.{0,3}[当由知应的视效自])表示临近被告的后面,匹配到“应该XXX”的表述形式。

本方案将“被告应该如何”的句型,作为原告主张的一种类型。(?<!())这是一种前置零宽断言的语法,表示在指定字符前面不允许出现什么内容,如(?<!(不|被告)),用于限制在“应”前面不允许出现否定概念“不”,并且要求不能在临近位置出现“被告”指代词,通常在法院观点中,被告后面连接被告名称,属于相对正式的原告请求陈述方式,如果“被告”后面紧邻“应XXX”句型,多为法官审判结论的表述形式。

4)(?<!及)([尚结仍])欠|约定了)这部分与3)中表达式是“或”的逻辑关系,本方案除了“应XXX”句型,还将“被告XXXX尚欠或者仍欠或者结欠,在或者双方约定了XXX”句型作为原告主张的一种类型;

5)[^。,,;;()]*([,,]并)?[^。,,;;()]{0,}表示当在切分的整句文本中匹配到上述两种表示原告主张的句型,继续向后匹配非断句字符,即匹配到断句字符结束,表示得到了原告主张内容。其中利用“([,,]并)?”这部分表达式,表示支持并列句式的多项原告主张内容。

或者,可以设定抽取表达式为:@(?<!向[^,。;,;]{0,10})(原告|公司)([^。;;辩人己因故了已证辩驳向]{4,}(e_原告主张后缀))@。

对于被告抗辩信息可以设定如下抽取表达式:@(e_被告抗辩前缀)[,,]?[^的而欠,。;,;]{5,10}[^。;;]{4,}@{0,5}e_被告抗辩后缀;或者为:@(?<!向)(被告|公司)[^,,。;;]{0,5}(e_被告抗辩前缀)[^。;;其该此故因]{4,}(辩解|理由|意见|观点|抗辩|辩.{0,2}主张|辩驳)(?!权)@

对于审判结果信息,至少包括五种结果,分别为请求支持、请求不支持、抗辩支持、部分支持和不予处理,则,对于不同审判结果可以设定不同抽取表达式,具体如下:

对于请求支持,可以设定抽取表达式为:@(e_原告主张前缀).{0,5}((未|不)[超高](?<!不)符合)@;或者为:@(被告|[^,。;,;故]{2,15}?公司)[^,。;,;认辩驳]*(?<!(不|被告))(理?应(?!.{0,3}[当由知的相视效自])[^。,,;;()]*([,,]并)?[^。;;,,的()]*|(?<!及)([尚结仍]欠|约定了)[,;,。;()]*)@

对于请求不支持,可以设定抽取表达式为:@均不予[^,。,;]*(。|;|;|,|,)@;或者为:@原告[^,。,;]{2,5}(诉请|请求).{0,5}不予[^,。,;]*(。|;|;|,|,)@

对于抗辩支持,可以设定抽取表达式为:@已经[^,。,;]*[偿还支付][^,。,;]*事实.{0,5}(?<!不)予[^,。,;]*(。|;|;|,|,)@或者为:@(辩解|理由|意见|观点|抗辩)[^。;;]{0,5}(?<!不)予[^,。;,;]*(。|;|;|,|,)@

对于部分支持,可以设定抽取表达式为:@(应?按[^,,。;;]{2,}?计算|应?实际(支付|偿还赔偿)[^,,。;;\d]{2,}?[\d,,\.]+元)@;或者为:@(仅|(?<!予以支持.{0,5})部分|范围内|\d+倍).{0,3}(支持|予).{0,}?。@

对于不予处理,可以设定抽取表达式为:@(?<!人民法院.{0,2})不.{0,3}处理@

步骤S132,对每个审判观点信息中各审判要素抽取节点与所述审判要素文本相对应,生成审判要素。

在本实例中,所述审判要素可以用信息候选列表表示,所述信息候选列表至少包括审判要素抽取节点的名称、与该节点相对应的文本内容以及位置索引等信息,例如被告抗辩信息候选列表至少包括审判要素抽取节点的名称,即,表名“被告抗辩”,所述被告抗辩信息候选列表至少包括“抗辩内容”和“位置索引”两列,其中,“抗辩内容”列用于缓存根据被告抗辩抽取表达式所抽取到的文本内容,每个抽取结果作为一行;“位置索引”用于缓存每行抽取结果在审判要素中的始末位置。

对于未到庭信息,在法院观点中通常只出现一次,而非多次,因此,对于未到庭信息可以直接存储于“未到庭信息列表”中,而非“未到庭信息候选列表”中。

可以理解的是,如果使用抽取表达式获取审判要素文本,则步骤S132的结果不会在步骤S133之前明显呈现,最终以审判要素的形式体现出来。

继续以示例(1)为例说明步骤S132至步骤S133,具体地,可以利用上述抽取表达式依次抽取步骤S102所得各信息块中的各审判要素。

具体地,首先获取第一信息块的文本内容,可以利用“未到庭信息”抽取表达式抽取与“未到庭信息”相对应的文本内容以及该内容对应的位置索引,存储于未到庭信息列表中;利用“原告主张信息”抽取表达式抽取与“原告主张信息”相对应的文本内容以及该内容对应的位置索引,存储于原告主张信息候选列表中;利用“被告抗辩信息”抽取表达式抽取与“被告抗辩信息”相对应的文本内容以及该内容对应的位置索引,存储于被告抗辩信息候选列表中;利用“审判结果信息”抽取表达式抽取与“审判结果信息”相对应的文本内容以及该内容对应的位置索引,存储于审判结果信息候选列表中。如果审判要素的抽取结果为空,则不做存储。

在对第一信息块处理完毕后,获取第二信息块的文本,采用与处理第一信息块相同的方法,依次抽取第二信息块中各审判要素,并将各审判要素依次存储于不同于第一信息块中各审判要素所存储的信息候选列表中,即,每块信息块均生成一组专属于本信息块的信息候选列表。

对于后续所有信息块,依次按照处理第二信息块的方法进行处理,最终获得多组信息候选列表。

步骤S133,对各审判要素进行关联处理,生成结构化审判观点信息。

在本实例中,本步骤可以包括以下步骤S1331和步骤S1332:

步骤S1331,根据每个审判观点信息中的审判要素生成审判要素列表,所述审判要素列表包括原告请求结果集、被告抗辩结果集和审判结果集。

在本实例中,步骤S132生成多组审判要素,即,多组信息候选列表,其中,每一个信息块对应一组信息候选列表,即,每个审判观点信息对应一组信息候选列表,同组内至少一个信息候选列表存储有内容,其余信息候选列表的内容可能为空。

进一步地,步骤S1331可以包括以下步骤S13311至步骤S13313:

步骤S13311,抽取审判要素生成审判观点信息候选集合。

依次获取各审判观点信息中相同审判要素对应的信息候选列表,并缓存于各审判要素对应的候选集中。例如,继续以示例(1)为例进行说明:依次获取第一审判观点信息对应的原告请求信息候选列表、第二审判观点信息对应的原告请求信息候选列表、……、直至第六审判观点信息对应的原告请求信息候选列表,将上述六个原告请求信息候选列表全部缓存于原告请求信息候选集合中。相应地,将六个被告抗辩信息候选列表全部缓存于被告抗辩结果候选集合中;将六个审判结果信息候选列表全部缓存于审判结果候选集合中。

步骤S13312,对所述审判观点信息候选集合进行去冗余处理,生成审判观点信息集合。

本实例中,每个审判观点信息候选集合中各信息候选列表中的信息可能存在冗余,因此,可将同一审判观点信息候选集合中各信息候选列表中的信息进行去除冗余处理,生成审判观点信息列表,各审判观点信息列表最终形成审判观点信息集合。

在本实例中,所述去除冗余处理具体可以为依据各文本内容所对应的位置索引判断各文本内容是否存在包含关系,如果存在包含关系,则采取去长留短的策略,删除较长的文本内容及其对应的位置索引,从而实现对信息候选列表中各文本内容的优化筛选,获得审判观点信息列表,再将审判观点信息列表封装于审判观点信息集合。

继续以示例(1)为例说明,汇总原告请求信息候选集合中各列表信息,包括文本内容及该文本内容所对应的位置索引,通过各位置索引判断各文本内容是否存在冗余信息,如果存在,则根据去长留短的策略删除较长的文本内容及其对应的位置索引,被删除所述文本内容及其对应位置索引后,原存储有该文本内容及对应位置索引的列表减少一条数据记录,去冗余处理完成后,每个原告请求信息候选列表相应地生成一个原告请求信息列表,所有原告请求信息列表封装为一个原告请求信息集合。

与原告请求信息集合相似地,生成被告抗辩结果信息集合和审判结果信息集合。

步骤S13313,对所述审判观点信息集合进行封装,生成审判要素列表。

在本实例中,本步骤具体可以为提取所述审判观点信息集合中各文本内容及对应的位置索引,并将所提取到的文本内容以及对应的位置索引封装于审判要素列表中。

继续以示例(1)为例进行说明,依次提取原告请求信息集合中各原告请求信息列表中的各条文本内容以及对应的位置索引,并将所述文本内容以及对应的位置索引存储于原告请求信息列表中。

与原告请求信息列表相似地,生成被告抗辩结果信息列表和审判结果信息列表。

步骤S1332,根据审判结果集中审判结果的顺序,依次对原告请求结果集中的原告请求和/或被告请求结果集中的被告请求以及相应的审判结果相互关联,生成结构化审判观点信息。

在本实例中,本步骤可以根据位置索引将原告请求信息列表以及被告抗辩信息列表中各文本内容与审判结果信息列表中的文本内容进行关联,从而得到结构化审判观点信息。

具体地,本步骤可以包括以下步骤S13321至步骤S13326:

步骤S13321,对各审判要素列表进行升序或者降序排序。

本实例对排序方式不做特别限定,可以采用升序方式,也可以采用降序方式,优选为升序方式以便于算法实现。

步骤S13322,获取请求-抗辩条目,所述请求-抗辩条目为原告主张信息列表以及被告抗辩结果信息列表中数据条目的总数量。

步骤S13323,建立部分请求-抗辩列表以及全部请求-抗辩列表。

步骤S13324,根据所述请求-抗辩条目将原告主张信息列表或者被告抗辩结果信息列表中的数据信息缓存于部分请求-抗辩列表以及全部请求-抗辩列表中。

具体地,如果所述请求-抗辩条目大于1,则将保留位置索引最大的原告主张信息或者被告抗辩信息,并将所保留的信息缓存于部分请求-抗辩列表中,其中,位置索引最大的原告主张信息或者被告抗辩信息为所述原告请求信息列表以及被告抗辩信息列表两个列表中位置索引最大的信息,包括文本内容及其对应的位置索引。

进一步地,如果所述请求-抗辩条目等于1,则将该请求-抗辩信息缓存于全部请求-抗辩列表。

步骤S13325,如果所述部分请求-抗辩列表不为空,则根据位置索引对所述部分请求-抗辩列表中的数赋值相应的审判结果。

在本实例中,如果所述部分请求-抗辩列表不为空,则可以判断缓存于该列表中的信息为原告请求信息还是被告抗辩信息,根据该信息的位置索引以及审判结果信息列表中的位置索引,可为该信息赋值相应的审判结果,例如,全部支持、不予支持、部分支持或者不予处理等。

相应地,与该信息类型相对立的另一信息类型则赋值为相对立的审判结果,例如,所述部分请求-抗辩列表中缓存有原告请求信息,并赋值为全部支持,则相应地,为与该原告请求对应的被告抗辩信息上赋值为不予支持。

步骤S13326,如果所述部分请求-抗辩列表为空,则调取全部请求-抗辩列表,并根据位置索引对所述全部请求-抗辩列表中的数赋值相应的审判结果。

本步骤的实现方式与步骤S13325相似,区别仅在于调取的列表为全部请求-抗辩列表,具体实现方式可参见步骤S13325,在此不再赘述。

原告请求信息列表与被告抗辩信息列表中各数据逐条被赋值审判结果后,生成结构化审判观点信息。

步骤S104,利用信息抽取模型抽取法院观点文本信息中的法律引用文本,生成结构化法律引用信息。

在本实例中,本步骤可以包括:

根据信息抽取模型中法律引用抽取节点确定法院观点文本信息中的法律引用节点字符,所述法律抽取节点为与所述审判观点信息中所引用法律条款具有对应关系的字符串,所述法律引用节点字符为所述审判观点信息中与法律引用抽取节点相对应法律条款内容的起始字符;

根据所述法律引用节点字符确定每个法律引用节点对应的法律引用文本,所述法律引用文本为从当前法律引用节点字符起至下一个法律引用节点字符之间的全部字符;

获取每个法律引用信息的位置索引;

根据所述法律引用信息以及其对应的位置索引生成法律引用信息列表,即,结构化法律引用信息。

继续以示例(1)为例说明本步骤的实现方式,可以利用“引用法律信息”抽取表达式抽取法院观点文本信息中与“引用法律信息”相对应的文本内容以及该内容对应的位置索引,并且依次存储于引用法律信息候选列表中。例如,示例(1)的法院观点文本信息中存在引用法律信息“《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第三十条、《中华人民共和国合同法》第一百九十六条、第一百九十七条、第一百九十八条、《中华人民共和国担保法》第十八条、第三十一条和《中华人民共和国民事诉讼法》第一百四十四条”,因此,抽取该引用法律信息的文本内容以及该内容所对应的位置索引,存储于法律信息列表中。

步骤S105,将所述个性化信息与结构化审判观点信息以及结构化法律引用信息进行封装,生成结构化法院观点信息。

在本实例中,如果法院观点信息中存在明确的法律依据,则在结构化法院观点信息中指明所依据的法律名称与法律条目。

具体地,本实例针对审判观点信息所识别提取的法律引用信息,可依据位置索引,将法律引用信息与对应的审判目标或者对象,即原告主张/被告抗辩进行关联映射,从而作为司法大数据应用服务的一种统计分析知识维度。

在本实例中,本步骤具体可以包括以下步骤S151至步骤S155:

步骤S151,根据原告请求的位置索引对结构化审判观点信息进行升序或者降序排列。

步骤S152,获取第一位置索引和第二位置索引,其中,第一位置索引为当前原告请求的位置索引,所述第二位置索引为下一条原告请求的位置索引。

步骤S153,关联被告抗辩信息,所关联被告抗辩信息的位置索引位于第一位置索引与第二位置索引之间。

步骤S154,关联原告请求法律依据信息,所关联原告请求法律依据信息的位置索引位于第一位置索引与被告抗辩信息的位置索引之间。

步骤S155,关联被告抗辩法律依据信息,生成结构化法院观点信息,所述被告抗辩法律依据信息的位置索引位于被告抗辩信息的位置索引与所述第二位置索引之间。

可以理解的是,上述处理法院观点的方法仅是示例性的,本领域技术人员根据上述的方法可以进行各种变形,修改或变形之后的内容也在本申请保护范围内。例如,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

图2示出本申请实施例提供的一种法院信息结构化装置200的结构框图,如图2所示,该装置200与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置200具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置200包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置200的操作系统(operating system,OS)中的软件功能模块。具体地,该装置200包括:

文本信息获取单元201,用于获取法院观点文本信息,所述法院观点文本信息包括个性化信息和至少一个审判观点信息;

文本信息切块单元202,用于对所述法院观点文本信息进行切块,获得个性化信息和审判观点信息;

结构化审判观点信息生成单元203,用于利用信息抽取模型抽取每个审判观点信息中的审判要素,根据所述审判要素生成至少一个结构化审判观点信息;

结构化法律引用信息生成单元204,还用于利用信息抽取模型抽取法院观点文本信息中的法律引用信息,生成结构化法律引用信息;

结构化法院观点信息生成单元205,用于将所述个性化信息与结构化审判观点信息以及结构化法律引用信息进行封装,生成结构化法院观点信息。

在一种可实现的方式中,所述文本信息切块单元202可以包括:

信息块切割子单元,用于根据所述切块标记字符将所述法院观点文本信息切割成多个信息块;

信息块清洗子单元,用于对每块所述信息块进行信息清洗,获得个性化子信息和审判观点信息;

个性化信息生成子单元,用于汇集各个所述个性化子信息,获得个性化信息。

在另一种可实现的方式中,所述文本信息切块单元202可以包括:

信息块清洗子单元,还用于对所述法院观点文本信息进行信息清洗,获得个性化信息和审判观点信息组;

审判观点信息生成子单元,用于根据切块标记字符将所述审判观点信息组切割成至少一个审判观点信息。

在一种可实现的方式中,所述结构化审判观点信息生成单元203可以包括:

文本信息抽取子单元,用于根据信息抽取模型中每个审判要素抽取节点获得审判要素文本;

文本对应子单元,用于对每个审判观点信息中各审判要素抽取节点与所述审判要素文本相对应,生成审判要素;

结构化信息生成子单元,用于对各审判要素进行关联处理,生成结构化审判观点信息。

在第一种实现方式中,所述文本信息抽取子单元具体包括:

节点字符确定模块,用于根据信息抽取模型中每个审判要素抽取节点确定每个审判观点信息中的审判要素节点字符,所述审判要素抽取节点为与所述审判观点信息中各审判要素具有对应关系的字符串,所述审判要素节点字符为所述审判观点信息中与所述审判要素抽取节点相对应审判要素内容的起始字符;

文本信息提取模块,用于根据所述审判要素节点字符确定每个审判要素节点对应的审判要素文本,所述审判要素文本为从当前审判要素节点字符起至下一个审判要素节点字符之间的全部字符。

在第二种实现方式中,所述文本信息抽取子单元具体包括:

文本信息提取模块,还用于使用抽取表达式从审判观点信息文本中直接抽取审判要素文本。

在一种可实现的方式中,所述结构化信息生成子单元可以包括:

审判要素列表生成模块,用于根据每个审判观点信息中的审判要素生成审判要素列表,所述审判要素列表包括原告请求结果集、被告抗辩结果集和审判结果集;

结构化信息生成模块,用于根据审判结果集中审判结果的顺序,依次对原告请求结果集中的原告请求和/或被告请求结果集中的被告请求以及相应的审判结果相互关联,生成结构化审判观点信息。

可选地,所述审判要素列表生成模块可以包括:

候选集合生成子模块,用于抽取审判要素生成审判观点信息候选集合;

冗余去除子模块,用于对所述审判观点信息候选集合进行去冗余处理,生成审判观点信息集合;

信息集合封装子模块,用于对所述审判观点信息集合进行封装,生成审判要素列表。

在一种可实现的方式中,结构化法律引用信息生成单元204可以包括:

节点字符确定子单元,用于根据信息抽取模型中法律引用抽取节点确定每个审判观点信息中的法律引用节点字符,所述法律抽取节点为与所述审判观点信息中所引用法律条款具有对应关系的字符串,所述法律引用节点字符为所述审判观点信息中与法律引用抽取节点相对应法律条款内容的起始字符;

文本信息提取子单元,用于根据所述法律引用节点字符确定每个法律引用节点对应的法律引用信息,所述法律引用信息为从当前法律引用节点字符起至下一个法律引用节点字符之间的全部字符;

位置索引获取子单元,用于获取每个法律引用信息的位置索引;

结构化信息生成子单元,还用于根据所述法律引用信息以及其对应的位置索引生成结构化法律引用信息。

在一种可实现的方式中,结构化法院观点信息生成单元205可以包括:

信息排序子单元,用于根据原告请求的位置索引对结构化审判观点信息进行升序或者降序排列;

位置索引获取子单元,还用于获取第一位置索引和第二位置索引,其中,第一位置索引为当前原告请求的位置索引,所述第二位置索引为下一条原告请求的位置索引;

信息关联子单元,用于关联被告抗辩信息,所关联被告抗辩信息的位置索引位于第一位置索引与第二位置索引之间;

信息关联子单元,还用于关联原告请求法律依据信息,所关联原告请求法律依据信息的位置索引位于第一位置索引与被告抗辩信息的位置索引之间;

信息关联子单元,还用于关联被告抗辩法律依据信息,所述被告抗辩法律依据信息的位置索引位于被告抗辩信息的位置索引与所述第二位置索引之间。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。

本申请实施例还提供一种电子设备,请参见图3,图3示出本申请实施例提供的一种电子设备300的结构框图。电子设备300可以包括处理器310、通信接口320、存储器330和至少一个通信总线340。其中,通信总线340用于实现这些组件直接的连接通信。其中,本申请实施例中的通信接口320用于与其他设备进行信令或数据的通信。处理器310可以是一种集成电路芯片,具有信号的处理能力。上述的处理器310可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器310也可以是任何常规的处理器等。存储器330可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。存储器330中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器310执行时,电子设备300可以执行上述方法实施例中的各个步骤。

电子设备300还可以包括存储控制器、输入输出单元、音频单元、显示单元。

所述存储器330、存储控制器、处理器310、外设接口、输入输出单元、音频单元、显示单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线340实现电性连接。所述处理器310用于执行存储器330中存储的可执行模块。并且,电子设备300用于执行下述方法:

获取法院观点文本信息,所述法院观点文本信息包括个性化信息和至少一个审判观点信息;

对所述法院观点文本信息进行切块,获得个性化信息和审判观点信息;

利用信息抽取模型抽取每个审判观点信息中的审判要素,根据所述审判要素生成至少一个结构化审判观点信息;

利用信息抽取模型抽取法院观点文本信息中的法律引用信息,生成一个法律引用信息列表;

将所述个性化信息与结构化审判观点信息以及法律引用信息进行封装,生成结构化法院观点信息。

输入输出单元用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元可以是,但不限于,鼠标和键盘等。

音频单元向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

显示单元在所述电子设备与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。

可以理解,图3所示的结构仅为示意,所述电子设备300还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。

本申请还提供一种计算机可读存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行方法实施例所述的方法。

本申请还提供一种法院观点信息结构化的计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号