首页> 中国专利> 一种通过人员行为轨迹识别重点人员的方法及系统

一种通过人员行为轨迹识别重点人员的方法及系统

摘要

本发明公开了一种通过人员行为轨迹识别重点人员的方法及系统;收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;建立动态模型;计算每个哈希表TOKEN串t

著录项

  • 公开/公告号CN107133646A

    专利类型发明专利

  • 公开/公告日2017-09-05

    原文格式PDF

  • 申请/专利权人 山东合天智汇信息技术有限公司;

    申请/专利号CN201710305675.0

  • 发明设计人 陈浩;王可鑫;段文良;

    申请日2017-05-03

  • 分类号

  • 代理机构济南圣达知识产权代理有限公司;

  • 代理人黄海丽

  • 地址 250000 山东省济南市高新区舜华路1号齐鲁软件园5号楼(创业广场E座)B409

  • 入库时间 2023-06-19 03:17:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-17

    授权

    授权

  • 2017-09-29

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20170503

    实质审查的生效

  • 2017-09-05

    公开

    公开

说明书

技术领域

本发明涉及一种通过人员行为轨迹识别重点人员的方法及系统。

背景技术

在日益飞速发展的信息技术支撑下,利用信息化手段管控犯罪前科、在逃人员等重点人员已经成为了公安机关研究的重要方向。重点人员日常活动时,产生的各项行为记录的数据信息,记载了重点人员的行动轨迹和方向。因此利用人员动态轨迹,来分析重点人员的类型,提高公安情报人员的研判效率,显得尤为重要。

而目前人员分类方法,要么是具有局限性,只能应用到单一场景,如只能识别上班族或者贩毒人员等单一类型,要么具有时效性,当时代发展,改变了人们的生活方式后,固定的识别算法便不再适用。

发明内容

本发明的目的就是为了解决上述问题,提供一种通过人员行为轨迹识别重点人员的方法及系统,它具有通过人员行为轨迹迅速准确识别重点人员的优点。

为了实现上述目的,本发明采用如下技术方案:

一种通过人员行为轨迹识别重点人员的方法,包括如下步骤:

步骤(1):收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;

步骤(2):对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;

从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;

步骤(3):建立动态模型;

每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;

步骤(4):计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;

步骤(5):从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;

步骤(6):建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;

步骤(7):重复步骤(5)-(6),直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表估计新人员为重点人员的可能性。

所述步骤(4)为:

P1(ti)表示TOKEN串ti在hashtable_true哈希表中出现的频率;

P2(ti)表示TOKEN串ti在hashtable_false哈希表中出现的频率。

所述步骤(5):利用hashtable_true哈希表和hashtable_false哈希表,推断出当样本人员轨迹信息中出现某个TOKEN串时,计算样本人员为重点人员的概率:

假设样本人员的TOKEN串包括t1、t2……tn

则P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;i的取值范围是1到n;

当收到一条新人员行为轨迹时,提取新人员行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串;利用新人员的TOKEN串查询hashtable_probability哈希表,得到TOKEN串的键值;

假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;

P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该新人员为重点人员的概率;

当P(A|t1,t2,t3......tm)超过预定阈值时,就判断人员为重点人员。

其中,

一种通过人员行为轨迹识别重点人员的系统,包括:

收集模块:收集重点人员和非重点人员的行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集;

特征提取模块:对重点人员轨迹信息集和非重点人员轨迹信息集的信息进行特征提取;

从重点人员轨迹信息集和非重点人员轨迹信息集中提取每个人行为轨迹信息中的位置特征和时间特征,将位置特征和时间特征作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频;

动态模型建立模块:每个人员行为轨迹信息对应一个哈希表,hashtable_true哈希表对应重点人员行为轨迹信息集,而hashtable_false哈希表对应非重点人员行为轨迹集合;每个哈希表中存储TOKEN串到字频的映射关系;

第一计算模块:计算hashtable_true哈希表和hashtable_false哈希表TOKEN串ti出现的概率;

第二计算模块:从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;

新哈希表建立模块:建立新的hashtable_probability哈希表,存储TOKEN串ti到P(A|ti)的映射;P(A|ti)表示在事件A中,样本人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率;

估计模块:直至每个重点人员和非重点人员轨迹均学习训练结束;根据建立的hashtable_probability哈希表能够估计新人员为重点人员的可能性。

本发明的有益效果:

1从建立重点人员轨迹信息集和非重点人员轨迹信息集中选择样本人员,利用样本人员的轨迹特征进行学习训练,计算样本人员为重点人员的概率;建立新的hashtable_probability哈希表,利用新的哈希表来识别重点人员,具有识别范围广的优点。

2通过设定阈值来判断是否为重点人员,具有识别精度高的优点。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

如图1所示,一种通过人员行为轨迹识别人员类型的方法,包括如下步骤:

1.收集大量人员行为轨迹数据,建立重点人员轨迹信息集和非重点人员轨迹信息集。

2.重点人员特征提取

以送餐员为例,送餐员具有明显的行为特征,在吃饭时间奔波在餐馆与小区、餐馆与办公区等之间,其轨迹一天内此刻最为密集,而且由于送餐员都有自己特定的送餐区域,其轨迹长时间内趋于一致性。

提取这些行为轨迹信息中的场所、时间等特征信息作为TOKEN串,并统计提取出的TOKEN串出现的次数和字频。

按照上述的方法分别处理重点人员轨迹信息集合非重点人员信息集的所有人员轨迹信息。

3.建立动态模型

每一个人员行为轨迹信息对应一个哈希表,hashtable_true对应重点人员行为轨迹信息集,而hashtable_false对应非重点人员行为轨迹集合。表中存储TOKEN串到字频的映射关系。

4.计算TOKEN出现的概率

计算每个哈希表中TOKEN串出现的概率P=(某TOKEN串的字频)/(对应哈希表的长度)。

5.计算新人员为重点人员的概率。

综合考虑hashtable_true和hashtable_false,推断出当新来的人员轨迹信息中出现某个TOKEN串时,该新人员为重点人员的概率。数学表达式为:

A事件----人员为重点人员;

t1,t2…….tn代表TOKEN串

则P(A|ti)表示在人员轨迹信息中出现TOKEN串ti时,该人员为重点人员的概率。

6.建立新的哈希表hashtable_probability存储TOKEN串ti到P(A|ti)的映射

7.至此,重点人员和非重点人员的学习过程结束。根据建立的哈希表hashtable_probability可以估计一封新到人员为重点人员的可能性。

当新到一条人员行为轨迹时,按照步骤2,生成TOKEN串。查询hashtable_probability得到该TOKEN串的键值。

假设由该新人员行为轨迹共得到m个TOKEN串t1、t2……tm,hashtable_probability哈希表中对应的值为P1、P2……Pm;P(A|t1,t2,t3......tm)表示在人员轨迹信息中同时出现多个TOKEN串t1、t2……tm时,该人员为重点人员的概率。

由复合概率公式可得

当P(A|t1,t2,t3......tm)超过预定阈值时,就可以判断人员为重点人员。

重点人员:一类具有明显特征的人员,如常驻人员、外卖人员、贩毒人员等。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号