公开/公告号CN112465189A
专利类型发明专利
公开/公告日2021-03-09
原文格式PDF
申请/专利权人 上海交通大学;
申请/专利号CN202011216101.4
申请日2020-11-04
分类号G06Q10/04(20120101);G06Q50/18(20120101);G06Q50/26(20120101);G06F16/2458(20190101);G06F16/29(20190101);
代理机构31220 上海旭诚知识产权代理有限公司;
代理人郑立
地址 200240 上海市闵行区东川路800号
入库时间 2023-06-19 10:08:35
技术领域
本发明涉及智能化法院审判管理领域,尤其涉及一种基于时空关联性分析的法院收结案数量预测方法。
背景技术
作为法院智能化管理与决策系统的重要内容之一,收结案数量的预测是智慧法院建设的关键环节,通过构建合理的审判管理决策系统,可以实现司法系统对人财物统一管理、司法人员动态调配的优化。
现有的司法案件收结案宏观态势研判系统集中于解决原始司法信息的收集、汇总、可视化模块,基于收结案数量这一单一维度,利用回归分析来拟合未来收结案数量的变化趋势。现阶段对法院决策支持方面的研究集中于司法数据,如案件数量、再犯性、位置等与外界环境指标,如自然因素、城市地理未知等之间的关联性,使用神经网络模型来对司法数据进行简单的预测。除了通过预测来提供决策管理,还有构建合理的指标评价体系衡量法官判案的公平性等指标。目前司法统计学中对收结案数量的预测研究还不是很充分,在对犯罪数量的预测问题中,仅仅只考虑案件数量这一单一指标进行自回归预测,预测的准确性还不够高。
因此,本领域的技术人员致力于开发一种基于时空关联性分析的法院收结案数量预测方法,同时考虑多种影响因素来进行预测,以提高预测的准确性。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何综合考虑多种影响因素来进行预测,以提高预测的准确性。
为实现上述目的,本发明提供了一种基于时空关联性分析的法院收结案数量预测方法,包括以下步骤:
步骤1、收集刑事案件收案数据,采集相关特征属性数据并构造属性数据集;
步骤2、对所述步骤1构造的所述属性数据集进行预处理,得到刑事案件数量分布图和关联属性特征数据矩阵;
步骤3、对所述刑事案件数量分布图和所述关联属性特征数据矩阵进行基于网格嵌入的空间关联性分析;
步骤4、基于长短时记忆神经网络进行时间关联性分析,预测下一时刻刑事案件收案数量;
步骤5、利用所述刑事案件数量分布图和所述关联属性特征数据矩阵,训练基于时空关联预测的刑事案件数量预测模型,分析误差。
进一步地,所述步骤1具体为:根据法院提供的审判质效评估报表确定司法指标和收案数量数据,从政府网站上采集刑事案件收案数据,收集与所述刑事案件发生有关的所述属性数据集;在时间维度上,所述属性数据集中所包括的每一个属性数据都是以天为单位;在空间维度上,所述属性数据集的数据细粒度划分至一个城市的各个区县,采集与一个城市中各个区县刑事案件发生有关的所述属性数据集。
进一步地,所述步骤2包括以下步骤:
步骤2.1、将待研究的城市划分为n个互不重合的空间小网格,将所述城市表示成一个小网格集合G={g
步骤2.2、对每一个所述时隙,将所述属性数据集中每一个所述属性数据进行如下空间维度预处理:将各个所述小网格的指定时间间隔内的若干个刑事案件数量和与所述刑事案件相关联的所述属性数据集中的每一个所述属性数据分别进行累加,得到各个所述小网格在指定时间间隔的刑事案件数量数据和关联属性特征数据;构建一个前t时刻包括所述刑事案件数量数据和所述关联属性特征数据的历史记录值{X
步骤2.3、根据观测数据集的{X
进一步地,所述步骤2.3中求均值μ
进一步地,所述步骤3包括:
步骤3.1、利用地理空间关联性分析模块挖掘基于地理空间距离的空间关联关系,得到基于地理空间距离的第一空间表征向量Z
步骤3.2、利用特征空间相似性分析模块挖掘基于地区属性特征相似性的空间关联关系,得到基于属性特征相似性的第二空间表征向量D
步骤3.3、经过融合层将所述第一空间表征向量和所述第二空间表征向量拼接在一起得到一组基于网格嵌入的第三空间表征向量Y
进一步地,步骤3.1具体为:利用卷积自编码器对每一个时隙的所述刑事案件数量分布图X
进一步地,步骤3.2具体为:基于每一个时隙的所述关联属性特征数据矩阵E
进一步地,所述步骤4具体为:
在所述基于长短时记忆神经网络的时间关联性分析中,将所述基于网格嵌入的第三空间表征向量{Y
进一步地,所述步骤5包括:
步骤5.1、将经过预处理后的数据划分为训练数据集和测试数据集;
步骤5.2:利用训练数据集,对已设定好合理参数的所述基于时空关联预测的刑事案件数量预测模型进行训练;
步骤5.3:将所述测试数据集的数据输入训练好的所述基于时空关联预测的刑事案件数量预测模型,进行前向计算得到对应的输出数据,反归一化后得到指定时间间隔内各地区的刑事案件数量分布图的预测值;
步骤5.4:将所述刑事案件数量分布图的预测值与真实值进行对比,计算误差,得到所述基于时空关联预测的刑事案件数量预测模型的误差。
进一步地,所述属性数据集至少包括经济状况数据、公共服务数据、POI数据和天气情况数据。
与现有技术方案相比,本发明的有益技术效果在于:本发明中不仅仅只考虑案件数量这一单一指标进行自回归预测,还综合考虑了影响犯罪活动的其他有意义的指标特征;为了提高预测的准确性,同时考虑时间和空间特征进行案件预测,设计空间关联分析算法将有强空间相关性的地区看作一类,充分考虑空间相似性进行预测以此来提高准确性。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的流程图;
图2是本发明的一个较佳实施例的空间关联分析的示意图;
图3为本发明和多个已有方法之间均方根误差对比图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
如图1所示为本发明的流程图,包括以下步骤:
步骤1、收集刑事案件收案数据,采集相关特征属性数据并构造属性数据集;
步骤2、对所述步骤1构造的所述属性数据集进行预处理,得到刑事案件数量分布图和关联属性特征数据矩阵;
步骤3、对所述刑事案件数量分布图和所述关联属性特征数据矩阵进行基于网格嵌入的空间关联性分析;
步骤4、基于长短时记忆神经网络(LSTM)进行时间关联性分析,预测下一时刻刑事案件收案数量;
步骤5、利用所述刑事案件数量分布图和所述关联属性特征数据矩阵,训练基于时空关联预测的刑事案件数量(GeST)预测模型,分析误差。
其中,步骤1具体为:根据法院提供的审判质效评估报表确定司法指标和收案数量数据,从政府网站上采集刑事案件收案数据,收集与所述刑事案件发生有关的所述属性数据集;在时间维度上,所述属性数据集中所包括的每一个属性数据都是以天为单位;在空间维度上,所述属性数据集的数据细粒度划分至一个城市的各个区县,采集与一个城市中各个区县刑事案件发生有关的所述属性数据集。所述属性数据集至少包括经济状况数据、公共服务数据、POI数据和天气情况数据。
步骤2包括以下步骤:
步骤2.1、将待研究的城市划分为n个互不重合的空间小网格,将所述城市表示成一个小网格集合G={g
步骤2.2、对每一个所述时隙,将所述属性数据集中每一个所述属性数据进行如下空间维度预处理:将各个所述小网格的指定时间间隔内的若干个刑事案件数量和与所述刑事案件相关联的所述属性数据集中的每一个所述属性数据分别进行累加,得到各个所述小网格在指定时间间隔的刑事案件数量数据和关联属性特征数据;构建一个前t时刻包括所述刑事案件数量数据和所述关联属性特征数据的历史记录值{X
步骤2.3、根据观测数据集的{X
步骤3包括:
步骤3.1、利用地理空间关联性分析模块挖掘基于地理空间距离的空间关联关系,得到基于地理空间距离的第一空间表征向量Z
步骤3.2、利用特征空间相似性分析模块挖掘基于地区属性特征相似性的空间关联关系,得到基于属性特征相似性的第二空间表征向量D
步骤3.3、经过融合层将所述第一空间表征向量和所述第二空间表征向量拼接在一起得到一组基于网格嵌入的第三空间表征向量Y
如图2所示,为空间关联分析的示意图。对于空间小网格{g1,g2,...,g9}按照地理空间相似性进行分类,采用卷积自编码器(CAE)来挖掘地理空间关联关系,得到基于地理空间距离的第一空间表征向量[z1,z2,...,zk]。对于空间小网格{g1,g2,...,g9},考虑基于属性特征相似性的空间关联关系,采用图卷积神经网络(GCN)来深入挖掘不同空间网格在属性特征上的关联性,得到基于属性特征相似性的第二空间表征向量[D1,D2,...,Dk]。最后经过融合层将第一空间表征向量和第二空间表征向量拼接在一起得到一组基于网格嵌入的第三空间表征向量[y1,y2,..,ym]。
步骤4具体为:
在所述基于长短时记忆神经网络的时间关联性分析中,将所述基于网格嵌入的第三空间表征向量{Y
步骤5包括:
步骤5.1、将经过预处理后的数据划分为训练数据集和测试数据集;
步骤5.2:利用训练数据集,对已设定好合理参数的所述基于时空关联预测的刑事案件数量预测模型进行训练;
步骤5.3:将所述测试数据集的数据输入训练好的所述基于时空关联预测的刑事案件数量预测模型,进行前向计算得到对应的输出数据,反归一化后得到指定时间间隔内各地区的刑事案件数量分布图的预测值;
步骤5.4:将所述刑事案件数量分布图的预测值与真实值进行对比,计算误差,得到所述基于时空关联预测的刑事案件数量预测模型的误差。
本实施案例的有效性可以通过下面的仿真实验来进一步说明。
(1)仿真内容
使用美国芝加哥的犯罪数据集(Crime-2001)和相关特征数据进行分析建模,将芝加哥地区按照经纬度排列成一个42km×46km的长方形二维矩阵,考虑到数据稀疏性等特征,细粒度分成一个10×10的网格图,实验预测的时间间隔是一天,获得2011-2018共8年的实验数据。并使用零均值对原始数据归一化,实验使用前六年的数据作为训练数据集,后两年数据作为测试数据集。
实验选取了过去已有工作中的几个经典预测模型作为对比:自回归(ARIMA)、线性回归(LR)、长短时记忆神经网络模型(LSTM)、卷积长短时记忆神经网络模型(ConvLSTM)、犯罪预测的时空相关性模型(TCP)、基于神经网络的条件随机场模型(NN-CCRF)。对比实验结果如图3所示,选用均方根误差结果作为性能评估指标,对四个季度的刑事案件数量进行预测,可以看出本发明基于时空关联预测的刑事案件数量预测模型(GeST)的方法的性能要优于对比模型性能,均方根误差(RMSE)的计算值相比较而言更小且在不同时间段上误差值波动更平稳。因此,实验证明了基于时空关联预测的刑事案件数量预测模型具有更好的预测精度和稳定性。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
机译: 机动车碰撞预测方法,涉及对可移动体的时空行为进行建模,并基于时空行为模型估计特定时间段内可移动体所占据的空间。
机译: 基于随机的森林基于森林的预测方法和道路表面条件系统使用时空特征
机译: 基于时空特征的随机森林的预测方法和道路表面状况系统