首页> 中国专利> 挖掘相关联犯罪嫌疑人的系统及方法

挖掘相关联犯罪嫌疑人的系统及方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及公安犯罪网络分析领域，特别是指在挖掘相关联犯罪嫌疑人的系统和方法。该系统系统包括关联量化模块、犯罪关联函数模块和结点筛选模块。本发明也提供了挖掘相关联犯罪嫌疑人的方法：1)在犯罪网络中找到中心犯罪嫌疑人的对应结点；2)构造关联人员集合；3)根据人员交互关联进行关联扩展；4)将被扩展结点的犯罪关联系数值不低于阈值的结点加入关联人员集合；5)重复步骤3)和4)，直到关联人员集合不再有新的结点加入或犯罪网络全部结点均被扩展；6)根据各个结点与中心犯罪嫌疑人的犯罪关联系数排序，取一定量结点作为相关联嫌疑犯进行排查。本发明的挖掘系统和方法效率大大提高，而且可以将犯罪关联全面地筛选。

著录项

公开/公告号CN101464877A

专利类型发明专利
公开/公告日2009-06-24

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN200810121668.6
发明设计人吴朝晖;夏超伦;姜晓红;
展开▼

申请日2008-10-27
分类号G06F17/30(20060101);G06F19/00(20060101);
代理机构33221 杭州裕阳专利事务所(普通合伙);
代理人张骁敏
地址 310027 浙江省杭州市西湖区浙大路38号
入库时间 2023-12-17 22:10:28

法律信息

法律状态公告日

法律状态信息

法律状态
2018-10-16

未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20130130 终止日期:20171027 申请日:20081027

专利权的终止
2013-01-30

授权

授权
2009-08-19

实质审查的生效

实质审查的生效
2009-06-24

公开

公开

说明书

技术领域

本发明涉及公安犯罪网络分析领域，特别是指在一种大规模犯罪网络中挖掘相关联犯罪嫌疑人的系统，另外还涉及挖掘相关联犯罪嫌疑人的方法。

背景技术

自911事件以来，各个国家的安全部门十分重视犯罪数据的搜集和相关数据库的建设，同时基于相关数据库在数据挖掘方面进行了一系列的研究。犯罪数据的分析以及挖掘是从显性的数据入手，寻找出某些隐性的有用信息。从犯罪网络中可能隐藏的心理、行为或者其他的因素来提炼出相关的模式，以此来提供线索、协助办案，同时，尽可能地把提取的特征模式用于监控之中，实现预警。

数据挖掘(Data Mining)旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。还有很多和这一术语相近似的术语，如从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。于这些概念相提并论，是因为数据挖掘瞄准的对象是阐述个体间联系的相关性知识、而非描述个体属性、支零破碎的数据。

现有的犯罪网络分析方法从手工方法到基于图像展现的分析最后到目前比较成熟的社会网络分析(SNA)。社会网络分析目前已经广泛应用于国家贸易关系的分析、社会人物关系的分析、社会结构的发现和理解以及组织通信行为的研究。但所有的分析目前还仅仅停留在手工分析的层面上，即仍然是所谓第一代的犯罪网络分析方法。这种分析方法面对庞大的数据量时，效率并不是很高，而且具有一定的随机性。干警通常是凭借多年的经验有目的地在茫茫数据中寻找自己认为有用的信息，事实上数据的分析依然是完全在靠人力完成

现有的挖掘系统及方法某些过于理论化，或者只有方法而缺乏一定数据的积累；某些可实用的、高性能的方法仅能处理中小规模的犯罪网络；而某些针对大规模犯罪网络的工具和方法，仅停留在初步挖掘或侧重于人工处理后的图形化展示，在挖掘方面仅担当辅助型的角色。这些挖掘系统和挖掘方法效率不高，依靠人力分析，随机性很强，容易遗漏。

发明内容

本发明的目的在于提供一种在大规模犯罪网络中高效、全面的挖掘相关联犯罪嫌疑人的系统。

本发明提供了一种挖掘相关联犯罪嫌疑人的系统，包括：

确定和量化犯罪网络中人员之间关联优先级的关联量化模块；

计算犯罪与中心犯罪嫌疑人关联系数，并构造关联人员集合的犯罪关联函数模块；

利用犯罪关联系数使关联人员集合大小始终控制在人力可排查的范围内的结点筛选模块。

进一步的，所述关联量化模块利用层次结构分析法确定每个关联在网络中的优先级；将优先级平均地映射到[0，1]空间进行量化。

进一步的，所述犯罪关联函数模块的关联函数f的定义为：

$f (i, c) = (\begin{matrix} \max {A_{ic}, \max {A_{ij} * f (i, j)}}, j = 1 . . . n & p \neq c \\ 1 & p = c \end{matrix});$

n：集合C的元素个数；

A_ij：结点i，j之间的直接犯罪关联值。

另外，本发明也提供了一种挖掘相关联犯罪嫌疑人的方法，该方法包括如下步骤：

1)用户输入中心犯罪嫌疑人的信息，在犯罪网络中找到对应结点；

2)利用犯罪关联函数模块构造关联人员集合，其初始元素为用户确定的中心犯罪嫌疑人的结点；

3)根据犯罪网络中的人员交互关联，选取关联人员集合中未被扩展过的每一个结点，将其定位于犯罪网络，并在该网络中进行关联扩展；

4)利用犯罪关联函数模块计算被扩展结点的犯罪关联系数值，将该值不低于阈值的结点加入关联人员集合；

5)重复步骤3)和4)，直到关联人员集合不再有新的结点加入或者犯罪网络全部结点均被扩展完毕；

6)根据关联人员集合中的各个结点与中心犯罪嫌疑人的犯罪关联系数，利用关联量化模块进行排序，取一定量结点作为候选的相关联嫌疑犯进行排查。

进一步的，所述步骤1)中确定的犯罪网络是一个定量表示可能的犯罪个体之间关联的优化图论模型，模型表达如下：

G＝(c，C，A，S，f)，其中：

G：犯罪网络，

c：中心犯罪嫌疑人，由用户输入，

C：犯罪网络中全部结点的集合，

A：犯罪网络中全部犯罪关联的集合，

f：计算犯罪关联系数的函数。

进一步的，所述步骤4)中关联人员集合新增的结点为犯罪网络中与中心犯罪嫌疑人相关联的一部分人群，定义为：S＝{x|f(x，c)≥k}，其中k为犯罪关联阈值；初始情况S＝{c}。

进一步的，所述步骤6)还包括必要时利用结点筛选模块使人员关联集合大小始终控制在人力可排查的范围内的步骤。

本发明与背景技术相比，具有的有益的效果是：实现结点数量为千万级(10⁷～10⁸)的犯罪网络完全扫描；控制关联人员集合的增长，使得该扫描过程可以在计算能力受到较大限制、低端的数据库服务器上较快地完成；将犯罪关联全面地筛选，再采用AHP方法确定优先级，最后使用平均等比量化，充分考虑到了多种犯罪关联在办案、计算分析中的复杂多样性，使得犯罪网络模型更加逼近真实情况；设计良好有效的犯罪关联函数，深入挖掘了犯罪行为之间存在关联性，并且使得在庞大的犯罪网络上的大多数操作可以在较浅深度内收敛，始终保持局部性访问；并且采用确定的挖掘方法，是一种稳定、可再现的方法。

本发明是针对相同网络不同案件背景进行优化建模，对多种犯罪关联进行细化提取分析，进而在此基础上展开优化控制候选结点数量得到犯罪嫌疑人挖掘结果。本发明通过建立包含信息更丰富、关联性更强的犯罪网络，加上合适的量化方法、良好的犯罪关联函数构造及，从而保证了更快的挖掘速度和更高的准确率。

附图说明

图1为犯罪网络与关联人员集合。

具体实施方式

本发明中挖掘相关联犯罪嫌疑人的系统主要包括关联量化模块、犯罪关联函数模块和结点筛选模块。

1、关联量化模块

该模块负责关联优先级的确定和量化。首先整合多个公安业务数据库，将社会人员关联信息和犯罪分子关联信息合并，并构造一个犯罪网络；在该网络中提取人员之间的各种关联信息，例如：同案犯关联、旅馆同房关联、电话通话关联、飞机同行关联、亲属关联、同事关联、同乡关联等；采用现有的成熟技术层次结构分析法(AHP)确定每个关联在网络中的优先级；将优先级平均地映射到[0，1]空间则完成量化过程；关联优先级会根据案件的不同而发生变化，可以通过修改判断矩阵来体现关联差异性，因此量化结果也会改变。

R为关联表达式，R(x，y，r)表示结点x，y之间存在关联集合r；其中 $r \subseteq Ur,$ Ur＝{同案犯，旅馆同房...}，为关联全集；

Pr(rx)表示关联rx的优先级，其中rx∈Ur；例如可以设置Pr(旅馆同房)>Pr(同乡)；

Q(rx)表示关联rx的量化数值，随优先级的增大而增大。

2、犯罪关联函数模块

该模块负责犯罪关联系数的计算。在计算第i个结点的犯罪关联系数时，首先判断i是否与中心犯罪嫌疑人c存在直接犯罪关系，若存在先将f(i，c)值暂时设为Pr(ric)，否则设为0；再从关联人员集合中选取未进行比较的结点，判断结点i通过其余任意结点j∈S与c进行关联的系数是否大于f(i，c)，如果大于就更新f(，c)值为Pr(rij)*f(j，c)；从而可以初步衡量i结点与中心犯罪嫌疑人c的关联程度。

关联函数f的定义：

$f (i, c) = (\begin{matrix} \max {A_{ic}, \max {A_{ij} * f (i, j)}}, j = 1 . . . n & p \neq c \\ 1 & p = c \end{matrix});$

n：集合C的元素个数；

Aij：结点i，j之间的直接犯罪关联值；

如图1为犯罪网络与关联人员集合，括号中的数字表示该点与中心犯罪嫌疑人c的犯罪关联系数，设置了k＝0.35，所以C₁，C₂，C₄，C₆四个结点与c共同构成了关联人员集合。

3、结点筛选模块

该模块负责维护关联集合，使其大小始终控制在人力可排查的范围内。当每个结点计算完毕时，如果关联集合的数量已经超出预设的集合最大结点数，那么对关联集合的每个元素按照它们的犯罪关联系数进行排序，从具有最小犯罪关联系数的结点开始删除，直到未删除的结点数量不超过集合最大结点数；若关联集合的结点数没有超过集合最大结点数，将关联系数小于阈值k的结点删除。

本发明挖掘相关联犯罪嫌疑人的方法，包括如下步骤：

1)用户输入中心犯罪嫌疑人的身份证号码，在犯罪网络中找到对应结点；

2)利用犯罪关联函数模块构造关联人员集合，其初始元素为用户确定的中心犯罪嫌疑人；

3)根据犯罪网络中的人员交互关联，选取关联人员集合中未被扩展过的每一个结点，将其定位于犯罪网络，并在该网络中进行关联扩展；

4)利用犯罪关联函数模块计算被扩展结点的犯罪关联系数值，将该值不低于阈值的结点加入关联人员集合；

5)重复步骤(3)和(4)，直到关联人员集合不再有新的结点加入或者犯罪网络全部结点均被扩展完毕。

6)利用关联量化模块，根据关联人员集合中的各个结点与中心犯罪嫌疑人

的犯罪关联系数进行排序，取一定量结点作为候选的相关联嫌疑犯进行排查。

其中，

步骤1)中确定的犯罪网络是一个定量表示可能的犯罪个体之间关联的优化图论模型，模型表达如下：

G：犯罪网络，G＝(c，C，A，S，f)，其中：

c：中心犯罪嫌疑人，由用户输入；

C：犯罪网络中全部结点的集合；

A：犯罪网络中全部犯罪关联的集合；

f：计算犯罪关联系数的函数；

步骤4)中的关联人员集合：该集合中的结点代表了犯罪网络中与中心犯罪嫌疑人相关联的一部分人群，定义为：S＝{x|f(x，c)≥k}，其中k为犯罪关联阈值；初始情况S＝{c}；

步骤4)中的犯罪关联函数：f为计算犯罪关联系数的函数。f(i，c)表示为结点i与中心结点c的犯罪关联程度。形式化定义为：

$f (i, c) = (\begin{matrix} \max {A_{ic}, \max {A_{ij} * f (i, j)}}, j = 1 . . . n & i \neq c \\ 1 & i = c \end{matrix})$

n：集合C的元素个数；

A_ij：结点i，j之间的直接犯罪关联值；

f(i，c)∈[0，1]；其中f(i，c)越大表明i，c之间存在犯罪关联的可能性越大。这样精确地定义与c的传递犯罪关联值。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 挖掘相关联犯罪嫌疑人的系统及方法 [P] . 中国专利： CN101464877A . 2009-06-24
2. 基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统 [P] . 中国专利： CN104408149B . 2017.12.12
3. Method and system for mining image searches to associate images with concepts [P] . 美国专利： US10146776B1 . 2018-12-04

机译：挖掘图像搜索以将图像与概念相关联的方法和系统
4. Method and system for mining image searches to associate images with concepts [P] . 美国专利： US9563646B1 . 2017-02-07

机译：挖掘图像搜索以将图像与概念相关联的方法和系统
5. Method and system for mining image searches to associate images with concepts [P] . 美国专利： US8065611B1 . 2011-11-22

机译：挖掘图像搜索以将图像与概念相关联的方法和系统