首页> 中国专利> 筛选适用法律条文的方法及装置

筛选适用法律条文的方法及装置

摘要

本发明提供了一种筛选适用法律条文的方法及装置,其中,首先滤除待分析案情描述文本中的噪声;之后,确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念;最后,基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为待分析案情描述文本筛选适用的法律条文。其中,构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。上述技术方案满足了从案情描述到法律条文推理适用的目的,能够基于待分析案情描述文本确定对应的法律概念,继而基于确定的法律概念筛选适用的法律条文,解决了现有技术中筛选法律条文不够精确的缺陷。

著录项

  • 公开/公告号CN109739950A

    专利类型发明专利

  • 公开/公告日2019-05-10

    原文格式PDF

  • 申请/专利权人 中国政法大学;

    申请/专利号CN201811589269.2

  • 发明设计人 马皑;宋业臻;

    申请日2018-12-25

  • 分类号G06F16/33(20190101);G06Q50/18(20120101);G06N3/08(20060101);

  • 代理机构11542 北京久诚知识产权代理事务所(特殊普通合伙);

  • 代理人余罡

  • 地址 102299 北京市昌平区府学路27号

  • 入库时间 2024-02-19 10:02:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-03-31

    授权

    授权

  • 2019-06-04

    实质审查的生效 IPC(主分类):G06F16/33 申请日:20181225

    实质审查的生效

  • 2019-05-10

    公开

    公开

说明书

技术领域

本发明涉及法律和计算领域,具体涉及一种筛选适用法律条文的方法及装置。

背景技术

目前,法律种类繁多,每种法律条文的数目巨大。在审理案件的过程中,需要在数量巨大的法律条文中筛选适用的法律条文,存在效率低,工作量大的缺陷。

现有技术中,已经实现了法律条文的检索、以及基于文本相似度或关键字检索目标法律条文的功能。但是,上述仅设检索功能的法律条文筛选不能满足从案情描述到法律条文推理适用的目的,功能上存在逻辑缺环。上述基于关键字或文本相似度检索目标法律条文的方法无法对案情描述文本中的法律概念进行理解,当描述文本出现文字偏差时,会因案情描述文本本身问题将适用条文进行错误推断,即缺乏法学理论作为支撑,易出现逻辑错误。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种筛选适用法律条文的方法及装置,解决了无法为待分析案情描述文本筛选适用的法律条文的缺陷。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

第一方面,本申请实施例提供了筛选适用法律条文的方法,包括:

滤除待分析案情描述文本中的噪声;

确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念;

基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为所述待分析案情描述文本筛选适用的法律条文;其中,所述构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。

在一种可能的实施方式中,所述滤除待分析案情描述文本中的噪声,包括:

利用预设的噪声数据库,从所述待分析案情描述文本中滤除噪声;其中所述噪声数据库包括至少一个噪声文本。

在一种可能的实施方式中,所述筛选适用法律条文的方法还包括建立所述噪声数据库的步骤:

获取多种预设种类案件中每种预设种类案件的多个案情描述文本;

针对每种预设种类案件,对该预设种类案件对应的每个案情描述文本进行切分词处理,得到该预设种类案件对应的分词词组;其中,所述分词词组中至少包括一个词汇;

计算所述多种预设种类案件对应的分词词组的交集,得到所述噪声数据库。

在一种可能的实施方式中,所述确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念,包括:

对滤除噪声后的待分析案情描述文本进行切分词处理,得到滤除噪声后的待分析案情描述文本的多个词汇;

基于深度神经网络模型,确定滤除噪声后的待分析案情描述文本的每个词汇对应的法律概念;其中,所述深度神经网络模型包括多个词汇,以及每个词汇对应的法律概念。

在一种可能的实施方式中,所述筛选适用法律条文的方法还包括建立所述深度神经网络模型的步骤:

获取与所述待分析案情描述文本属于同一预设种类的案件的多个案情描述文本,得到多个样本案情描述文本;

获取与每个样本案情描述文本中的每个词汇对应的法律概念;

将每个样本案情描述文本中的每个词汇与对应的法律概念建立对应关系。

在一种可能的实施方式中,筛选适用法律条文的方法还包括:

同一法律概念对应的词汇为多个的情况下,基于每个词汇的词频,将该法律概念对应的词汇进行排序。

在一种可能的实施方式中,筛选适用法律条文的方法还包括:

为每个样本案情描述文本中的每个词汇设置对应的编码。

在一种可能的实施方式中,所述深度神经网络模型的激活函数为Sigmoid函数为:

f(x)=(wx-θ)

式中,w表示上一个神经元与下一个神经的链接权值,θ表示激活阈值,x表示待分析案情描述文本中的词汇,f(x)为分析案情描述文本中的词汇对应的法律概念。

在一种可能的实施方式中,在所述构成要件符合性条件包括多个法律概念的情况下,各个法律概念之间具有第一预设逻辑关系;

在所述违法性条件包括多个法律概念的情况下,各个法律概念之间具有第二预设逻辑关系;

在所述有责性条件包括多个法律概念的情况下,各个法律概念之间具有第三预设逻辑关系。

第二方面,本申请实施例提供了一种筛选适用法律条文的装置,,包括:

去燥模块,用于滤除待分析案情描述文本中的噪声;

概念确定模块,用于确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念;

条文筛选模块,用于基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为所述待分析案情描述文本筛选适用的法律条文;其中,所述构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。

(三)有益效果

本发明实施例提供了一种筛选适用法律条文的方法及装置。具备以下有益效果:

本发明实施例首先滤除待分析案情描述文本中的噪声;之后,确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念;最后,基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为待分析案情描述文本筛选适用的法律条文。其中,构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。上述技术方案满足从案情描述到法律条文推理适用的目的,能够基于待分析案情描述文本确定对应的法律概念,继而基于确定的法律概念筛选适用的法律条文,解决了现有技术中筛选法律条文不够精确的缺陷。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示意性的示出了本发明一实施例的筛选适用法律条文的方法流程图;

图2示意性的示出了本发明另一实施例的建立深度神经网络模型流程图;

图3示意性的示出了本发明一实施例筛选适用法律条文装置的框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本申请实施例提供了一种筛选适用法律条文的方法,该方法满足了从案情描述到法律条文推理适用的目的,能够基于待分析案情描述文本确定对应的法律概念,继而基于确定的法律概念筛选适用的法律条文,解决了现有技术中筛选法律条文不够精确的缺陷。具体地,上述筛选适用法律条文的方法包括如下步骤:

S110、滤除待分析案情描述文本中的噪声。

这里,具体利用如下步骤滤除噪声:利用预设的噪声数据库,从所述待分析案情描述文本中滤除噪声;其中所述噪声数据库包括至少一个噪声文本。

在具体实施时,还可以利用如下步骤建立所述噪声数据库:

S1101、获取多种预设种类案件中每种预设种类案件的多个案情描述文本。

上述预设种类案件为行政类案件、刑事类案件、民事类案件或商事类案件等。

S1102、针对每种预设种类案件,对该预设种类案件对应的每个案情描述文本进行切分词处理,得到该预设种类案件对应的分词词组;其中,所述分词词组中至少包括一个词汇。

上述分词词组即为一个词汇集合。

S1103、计算所述多种预设种类案件对应的分词词组的交集,得到所述噪声数据库。

S120、确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念。

在具体实施时,可以利用如下步骤确定每个词汇对应的法律概念:

S1201、对滤除噪声后的待分析案情描述文本进行切分词处理,得到滤除噪声后的待分析案情描述文本的多个词汇。

A1202、基于深度神经网络模型,确定滤除噪声后的待分析案情描述文本的每个词汇对应的法律概念;其中,所述深度神经网络模型包括多个词汇,以及每个词汇对应的法律概念。

本步骤实现了从词汇到法律概念的映射。

S130、基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为所述待分析案情描述文本筛选适用的法律条文;其中,所述构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。

如图2所示,在一些实施例中,上述筛选适用法律条文的方法还包括建立所述深度神经网络模型的步骤:

S210、获取与所述待分析案情描述文本属于同一预设种类的案件的多个案情描述文本,得到多个样本案情描述文本。

S220、获取与每个样本案情描述文本中的每个词汇对应的法律概念。

在执行此步骤之前,需要执行将每个样本案情描述文本进行切分词的处理。

S230、将每个样本案情描述文本中的每个词汇与对应的法律概念建立对应关系。

上述根据与所述待分析案情描述文本属于同一预设种类的案件所对应的法学理论,将对应的案情描述文本中的句子标注出,并将切分的词汇与列举出的对应法律概念进行一一匹配。

在具体实施时,可以为每个样本案情描述文本中的每个词汇设置对应的编码。将法律概念与相应的描述词汇组成数组,如:“故意”-描述“故意”的词汇,编码集合:

U=(11,12,13,1x,......)

U作为训练数据、测试数据的x值,是否属于该法律概念描述词为y值,其中y=0/1,属于该法律概念描述则为1,否则描述为0。

在具体实施时,同一法律概念对应的词汇为多个的情况下,基于每个词汇的词频,将该法律概念对应的词汇进行排序。

上述深度神经网络模型的激活函数为Sigmoid函数为:

f(x)=(wx-θ)

式中,w表示上一个神经元与下一个神经的链接权值,θ表示激活阈值,x表示待分析案情描述文本中的词汇,f(x)为待分析案情描述文本中的词汇对应的法律概念。

上述深度神经网络为7层的BP申请网络。上述神经网络利用训练数据进行训练,并使用测试数据进行测试,测试确定的该申请网络对法律概念判断准确度超过98%。

在一些实施例中,在所述构成要件符合性条件包括多个法律概念的情况下,各个法律概念之间具有第一预设逻辑关系。

在所述违法性条件包括多个法律概念的情况下,各个法律概念之间具有第二预设逻辑关系。

在所述有责性条件包括多个法律概念的情况下,各个法律概念之间具有第三预设逻辑关系。

上述预设逻辑关系例如可以是指两个法律概念之间的“或”、“且”等关系。例如,符合法律概念A、且符合法律概念B......则符合“构成要件符合性条件”。违法性条件和有责性条件利用类似的方法进行判断。若上述三种条件的逻辑运算均判断为“是”,则生成类似的结论:“该案情描述适用于xx条xx罪名”。

以上实施例,利用差异类型的案件案情描述文本分词、求词汇集合交集方法计算噪声数据库。采用法学概念与词汇一一对应并编码设置,实现将案情文本与对应法律概念变为数字集合。以上实施例根据法学理论设计逻辑运算规则进行案情适用法律条文判断。

以上实施例,完善了既有法律条文检索中缺乏从案情描述到法律概念抽象分析到法律条文推理适用功能的缺点。完善了既有法律条文推理适用方法中缺乏法学理论支撑的缺点。采用深度神经网络技术,提升传统关键词检索匹配方法中的效率较低、误差率高的缺点。

以上实施例,公开了一个基于汉语自然语言处理技术、深度神经网络技术与法学理论的法律概念理解与法律条文适用的人工智能方法,完成从案情描述到法律概念理解到法律条文自动推理、适用的目的。

如图3所示,本申请实施例还公开了一种筛选适用法律条文的装置包括:

去燥模块301,用于滤除待分析案情描述文本中的噪声;

概念确定模块302、,用于确定滤除噪声后的待分析案情描述文本中的每个词汇对应的法律概念;

条文筛选模303,用于基于待分析案情描述文本对应的多个法律概念,以及与每条法律条文匹配的构成要件符合性条件、违法性条件和有责性条件,为所述待分析案情描述文本筛选适用的法律条文;其中,所述构成要件符合性条件、违法性条件以及有责性条件均至少包括一个法律概念。

本发明实施例的方法中的每个步骤是与本发明实施例的装置在筛选适用的法律条文的过程中的步骤一一对应的,本发明实施例的装置在筛选适用的法律条文的过程中每个步骤均包含在本发明实施例的方法中,因此,对于重复的部分,这里不再进行赘述。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号