首页> 中国专利> 用于识别智能卡与移动电话之间的关联关系的系统和方法

用于识别智能卡与移动电话之间的关联关系的系统和方法

摘要

本发明提出一种用于识别智能卡与移动电话之间的关联关系的系统和方法该系统包含:选择装置,用于从智能卡的刷卡记录集合中选择多个刷卡记录对,其中,所述多个刷卡记录对中的每条刷卡记录包含刷卡位置和对应的刷卡时间;计算装置,用于计算所述刷卡记录对的刷卡位置和对应的刷卡时间与移动电话的日志记录中记录的移动电话行为的行为位置和行为时间上的重叠程度;判断装置,如果所述重叠程度大于一个预定的阈值,判断装置判定该刷卡记录对与该移动电话的日志记录中记录的移动电话行为重叠;如果所述多个刷卡记录对中的每个刷卡记录对都与该移动电话的日志记录中记录的移动电话行为重叠,则判定该智能卡与该移动电话是关联的。

著录项

  • 公开/公告号CN102467771A

    专利类型发明专利

  • 公开/公告日2012-05-23

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN201010538301.1

  • 发明设计人 潘平;朱延峰;张轶博;

    申请日2010-10-29

  • 分类号G07F7/08(20060101);

  • 代理机构11256 北京市金杜律师事务所;

  • 代理人吴立明;陈姗姗

  • 地址 美国纽约阿芒克

  • 入库时间 2023-12-18 05:12:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-11-05

    授权

    授权

  • 2012-07-04

    实质审查的生效 IPC(主分类):G07F7/08 申请日:20101029

    实质审查的生效

  • 2012-05-23

    公开

    公开

说明书

技术领域

本发明涉及物联网技术,尤其涉及智能卡系统与移动电话系统,特 别涉及智能卡与移动电话之间的关联分析。

背景技术

现今,人们越来越多地使用移动电话和智能卡(Smart Card)-如 一卡通交通卡之类的磁卡或RFID卡)。现实社会中,智能卡和移动电 话大多都是单独使用的。实际上,对于一个特定的用户来说,其所使用 的智能卡和移动电话是关联的,就是说,其智能卡和移动电话都是该用 户使用的。

虽然每个用户的智能卡与移动电话存在着这样的关联性,但是除了 用户自己,他人并不知道特定智能卡与特定移动电话之间的关联关系。 如果有一个系统可以将智能卡和移动电话关联起来,就可以将对智能卡 用户有影响的事件及时通过移动电话告知用户。例如,智能卡用户经常 乘坐的公交车遭遇严重拥堵,公共部门可以针对智能卡用户的出行规律 有针对性地通过同一个用户的移动电话向用户通报交通情况,以便用户 及时调整线路。此外,商家也可以分析用户的智能卡刷卡记录分析用户 的消费习惯,利用智能卡与移动电话的关联关系,更加精准地通过移动 电话为用户提供各种服务。

发明内容

虽然现在已经出现了将智能卡的功能和移动电话的功能集成在一 起的移动产品,但是,大多数用户使用的智能卡和移动电话都是分开使 用的,因此,存在这样的需求,即识别智能卡与移动电话之间的关联关 系。

为此,一方面,本发明提出一种用于识别智能卡与移动电话之间的 关联关系的方法,包含对给定的智能卡和移动电话执行的以下步骤:

从所述智能卡的刷卡记录集合中选择多个刷卡记录对,其中,所述 多个刷卡记录对中的每条刷卡记录包含刷卡位置和对应的刷卡时间;

对于所述多个刷卡记录对中的每个刷卡记录对,执行以下步骤:

计算所述刷卡记录对的刷卡位置和对应的刷卡时间与所述移动电 话的日志记录中记录的移动电话行为的行为位置和行为时间上的重叠 程度;

如果所述重叠程度大于一个预定的阈值,则判定该刷卡记录对与该 移动电话的日志记录中记录的移动电话行为重叠;

如果所述多个刷卡记录对中的每个刷卡记录对都与该候选移动电 话的日志记录中记录的移动电话行为重叠,则判定该智能卡与该移动电 话是关联的。

另一方面,本发明提出一种用于识别智能卡与移动电话之间的关联 关系的系统,包含:选择装置,用于从智能卡的刷卡记录集合中选择多 个刷卡记录对,其中,所述多个刷卡记录对中的每条刷卡记录包含刷卡 位置和对应的刷卡时间;计算装置,用于计算所述刷卡记录对的刷卡位 置和对应的刷卡时间与移动电话的日志记录中记录的移动电话行为的 行为位置和行为时间上的重叠程度;判断装置,如果所述重叠程度大于 一个预定的阈值,判断装置判定该刷卡记录对与该移动电话的日志记录 中记录的移动电话行为重叠;如果所述多个刷卡记录对中的每个刷卡记 录对都与该移动电话的日志记录中记录的移动电话行为重叠,则判定该 智能卡与该移动电话是关联的。

附图说明

所附权利要求中阐述了被认为是本发明的特点的创造性特征。但 是,通过参照附图阅读下面对示例性实施例的详细说明可更好地理解发 明本身以及其使用模式、另外的目标、特征以及优点,在附图中:

图1示意性地表示一个基于智能卡(Smart Card)的电子票务系统;

图2示意性表示一个移动网络及其工作原理;

图3是按照本发明的关联分析系统与数据源的关系的示意图;

图4是按照本发明实施例的用于识别智能卡与移动电话之间的关联 关系方法的示意流程图;

图5是按照本发明实施例的基于位置区更新进行关联分析的示意 图;

图6是按照本发明实施例的基于移动电话通信事件进行关联分析的 示意图;

图7是按照本发明实施例的用于识别智能卡与移动电话之间的关联 关系的系统的简单框图。

具体实施方式

下面参照附图来说明本发明的实施例。在下面的说明中,阐述了许 多具体细节以便更全面地了解本发明。但是,对于本技术领域内的技术 人员很明显,本发明的实现可不具有这些具体细节。此外,应当理解的 是,本发明并不限于所介绍的特定实施例。相反,可以考虑用下面的特 征和元素的任意组合来实施和实践本发明。而无论它们是否涉及不同的 实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应 被看作是所附权利要求的要素或限定,除非权利要求中明确提出。

图1示意性地表示一个基于智能卡的电子票务系统。图1所示的智 能卡系统100由以下四个部分构成:智能卡110、读卡器120、数据中 心130和数据处理系统140。

下文介绍系统100及其各部分的工作方式、记录同步方法,以及用 于本发明的关联分析的基本数据。

智能卡110即用户持有的电子卡片,如一卡通等磁卡或RFID卡。智 能卡中记录有卡片标识(Card ID)、刷卡信息(即消费记录,如某日 某时刻,在某处消费或者上/下某车)、账户信息(如账户余额)等。

读卡器120用于读取智能卡110中的信息,根据实际情况形成消费 记录或刷卡信息,并将相关信息(包括记录和账户余额)回写至智能卡 110,同时在读卡器中保存消费记录的拷贝。读卡器的种类很多,例如 位于地铁站的固定刷卡系统120-1、安装在公交车上的移动刷卡系统 102-2、零售点/自动售货机上的刷卡系统(未予示出)等。

数据中心130用于存储所有的消费记录和充值记录,以供日后对账 及分析用。

数据处理系统140根据数据中心的消费记录完成诸如数据清洗等各 种数据处理工作。

智能卡系统100的数据中心130中的每条消费记录或刷卡记录中,至 少包含以下项目:

智能卡标识(Card ID);时间标签(例如刷卡时间);刷卡位置(例 如上/下车地点);操作类别(例如上车、下车、消费等);以及其它 信息(消费数量、账户余额等)。

在获知智能卡标识的情况下,可以通过数据中心,对智能卡在指定 时段内的所有刷卡记录进行查询,通过查看每条刷卡记录中的内容,可 以清楚地还原智能卡的持有人在该时段内的刷卡情况,即出行和/或消 费情况。

例如,Alice在2010年9月5日上午8:20由上地出门乘坐地铁、换 乘公交车去往北京师范大学,在9:35到达北京师范大学。这一过程中 将生成刷卡记录,刷卡记录中包含如下面的表1所例示的内容。

需要指出的是,表1的内容及其格式,仅仅是示例性的,例如,为 了表述方便,表1中用自然语言描述操作类型和详细信息。另外,所述 技术领域的技术人员应该知道,GIS信息可以直接来自刷卡记录,或者 可以根据刷卡记录中记载的位置信息加以转换而获得。

表1

图2表示一个移动电话网络及其工作原理,用以示例性地说明移动 电话网络的事件处理/更新机制、移动电话的定位和呼叫记录CDR(Call  Detail Record)。

首先介绍位置区(Location Area)和蜂窝小区(Cell)的概念。

移动电话通过无线基站(Base Station)接入移动网络中。在通话 过程中,移动用户的所有信息均通过包含基站在内的移动链路进行传 递。

为了达到频率复用,一个基站往往覆盖多个蜂窝区域,这样的区域 被称为蜂窝小区,蜂窝小区(cell)的半径由几十米到几十公里不等。

一个大型的移动网络往往包含了数以万计的蜂窝小区,为了能够便 捷有效地使用并关联这些基站和蜂窝小区,将基站和蜂窝小区划分为多 个位置区,每个位置区中包含多个基站和蜂窝小区。

图2所示的移动网络200中,有三个位置区2A、2B和2C,每个位置 区又包含多个基站BS和蜂窝小区Cell。

位置区由位置区标识LAC来唯一标识,蜂窝小区由蜂窝小区标识 (Cell-ID)来唯一标识。在本文中,在上下文清楚的情况下,有时用“位 置区”表示“位置区标识”,反之亦然;有时用“蜂窝小区”表示“蜂 窝小区标识”,反之亦然。

移动电话250在移动网络200中移动时,其所处的蜂窝小区和位置 区都会随着时间而发生变化。每次发生位置区更新时,可以通过更新前 的LAC1和更新后的LAC2来标定两个相邻位置区的重叠区域。在获知用 户的位置区更新信息和用户在通话过程中留下的蜂窝小区标识的前提 下,可以利用已知的蜂窝小区和位置区的地理位置GIS(Geographic  Information System)信息之间的关系,实现用户的定位。例如:编号 AE4D的基站覆盖的蜂窝小区为以地点P1为中心、半径200米的区域; 如果发现移动电话的用户当前的蜂窝小区标识变为AE4D,即可推定用户 进入地点P1附近。

以下说明位置区标识和蜂窝小区标识的获取。

作为重要的通讯信息,位置区标识LAC和蜂窝小区标识Cell-ID大 量出现在移动网络的信令中:

●在移动网络200中移动的移动电话250的用户,一旦从一个位置 区进入一个新的位置区,移动电话250会自动向移动网络200上 报位置区更新事件,更新前的LAC和更新后的LAC可以由更新事 件中获得。

●处于服务中(包括通话中、上网中、短信/彩信/WAP发送或接收中) 的用户,其通信数据中包含当前的蜂窝小区标识,可以直接从通 信数据中获取蜂窝小区标识。

从移动电话250发送的信令和数据中,可以获得相应的位置区/蜂窝 小区信息,记录在移动电话的呼叫记录(CDR)中,作为移动电话的日 志记录的一部分。移动电话的日志记录至少包含以下内容:

●用户标识(IMSI,International Mobile Subscriber Identity), 用户标识IMSI也可称作移动电话标识,与用户的电话号码一一对 应;

●时间标签,表示移动电话的行为的发生时刻,例如发生位置区更 新的时刻;

●事件类别(位置区更新、呼入/呼出信令等);

●详细信息(位置区更新前的LAC、位置区更新后的LAC、通话/短 信发生时的Cell-ID等)。

表2

表2示意性地表示移动电话标识为“7893242132”的移动电话的CDR 中的两条记录的部分内容。流水号0001的记录中,“类型”表示移动 电话的行为是发生位置区变更,“ID”表示位置区标识,“时间标签” 表示该行为的发生时刻是2010年9月14日11:20分,“GIS信息”用 GIS信息表示该行为发生的位置;类似地,流水号0002的记录中,“类 型”表示移动电话的行为是电话通信,“ID”表示蜂窝小区标识,“时 间标签”表示该行为的发生时刻是2010年9月14日13:50分,“GIS 信息”用GIS信息表示该行为发生的位置。

图3是按照本发明的关联分析系统与数据源的关系的示意图。图3 中包括三个部分,关联分析系统300、智能卡系统(例如公交卡系统) 310和移动系统(亦称“移动网络”)320。

智能卡系统和移动系统出于自身管理的需要,保存有各种数据。

在智能卡系统310中,智能卡110的刷卡记录或交易记录311被定 期上载到数据中心130。这些数据可以通过开放服务网关(OSG)313提 供出来,或者可以通过文件的形式提供出来。

在移动系统320中,移动电话在移动网络200中发生的行为,包括 位置区的变更、呼入呼出、发送和接收,被以日志记录321的形式提交 并存储在移动交换中心(MSC,Mobile Switching Center)323中,也 可以通过文件的形式或通过其它方式提供出来

本发明的关联分析系统300,可以直接使用智能卡系统310和移动 系统320中的数据,或者将其中的数据进行简单转换后加以使用。

下面结合附图4,详细介绍识别智能卡与移动电话之间的关联关系的 方法及其实施例。

本发明方法采用的核心技术,是时域关联分析。时域关联分析通过 分析智能卡系统记录与移动系统记录的时间段的交叠程度,识别智能卡 系统记录与移动系统记录的关联度。

更具体来说,通过对多个时段(例如多天)发生的智能卡交易记录 与移动系统CDR,分别按不同时段进行关联分析,即对给定的智能卡与 移动电话,计算它们在不同时段的关联度,进而确定它们之间的关联关 系。

图4是本发明实施例的关联分析方法的示意流程图。如图所示,按 照本发明实施例的用于识别智能卡与移动电话之间的关联关系的方法, 包含以下步骤:

首先选定一对智能卡和移动电话,作为待匹配的候选智能卡和候选 移动电话,执行步骤S410-S430。

在步骤S410,从所述智能卡的刷卡记录集合中选择多个(n个)刷 卡记录对,其中,所述多个刷卡记录对中的每条刷卡记录包含刷卡位置 和对应的刷卡时间。

智能卡记录的每个刷卡记录对,包括两个刷卡记录,这两个刷卡记 录分别记载了两个刷卡位置和相应的刷卡时刻,两个刷卡时刻经历一个 时间段。这两个时刻最好是刷卡记录集合中两个连续的时刻。如前文结 合图3所述,根据智能卡标识就可以从智能卡系统310中获得特定智能 卡的刷卡记录集合,从中可以选择一个或多个刷卡记录。

在步骤420,对于多个刷卡记录对中的每个刷卡记录对,计算所述 刷卡记录对的刷卡位置和对应的刷卡时间与所述移动电话的日志记录 中记录的移动电话行为的行为位置和行为时间上的重叠程度。

该步骤实际上是分时间段比较智能卡刷卡记录和移动电话的日志 记录,判断在每个时间段该智能卡与移动电话的关联关系。

在步骤S430,判断所述重叠程度是否大于一个预定的阈值。如果所 述重叠程度大于一个预定的阈值,则判定该刷卡记录对与该候选移动电 话的日志记录中记录的移动电话行为重叠。

如果所述重叠程度不大于一个预定的阈值,则可判定该候选智能卡 与该候选移动电话是不关联的,于是,对该候选智能卡和候选移动电话 是否关联的分析就此结束。

在步骤S440,判断是否所述多个刷卡记录对中的每个刷卡记录对都 与该候选移动电话的日志记录中记录的移动电话行为重叠。

如果是,则判定该候选智能卡与该候选移动电话是关联的。对该候 选智能卡和候选移动电话是否关联的分析就此结束。

然后可以选择另一对候选智能卡和移动电话进行关联分析,如此循 环。

图4表示的是选择了n个刷卡记录对,按照本发明的一个实施例, 所述从所述智能卡的刷卡记录集合中选择多个刷卡记录对,包括选择具 有不同的刷卡日期的刷卡记录对。

例如,第1个刷卡记录对的刷卡日期是2010年1月31日,第2个 刷卡记录对的刷卡日期是2010年1月30日......依此类推。

显然,选择具有不同的刷卡日期的刷卡记录对,可以提高关联分析 的准确性,并且,选择的刷卡记录对的数量越多,准确度越高。一般来 说,可以在实践中总结经验,确定刷卡记录对合适的数量。

前文在对移动系统的介绍中指出,移动电话的日志记录中可以包含 移动电话的位置区更新的信息,也可能包含记录在移动电话通信的情况 下留下的蜂窝小区的信息。因此,在具体实施本发明时,可以采用不同 的方式来执行步骤420。

按照本发明的一个实施例,基于位置区更新的进行关联分析。具体 来说,在步骤420计算所述刷卡记录对的刷卡位置和对应的刷卡时间与 所述移动电话的日志记录中记录的移动电话行为的行为位置和行为时 间上的重叠程度时,可以采用下述步骤:

从移动电话的日志记录中选择一个位置区更新记录对,该位置区更 新记录对与刷卡记录对在地理位置上重叠;计算刷卡记录对与位置区更 新记录对在时间上的重叠程度,作为所述刷卡位置和对应的刷卡时间与 所述候选移动电话的日志记录中记录的移动电话行为的行为位置和行 为时间上的重叠程度。

图5是按照本发明实施例的基于位置区更新进行关联分析的示意 图。

图5中,将表示智能卡刷卡记录中的第i次刷卡记录,记为Si={ti′,ri}, 其中ti′表示第i次刷卡的时间,ri表示第i次刷卡的位置。刷卡位置信息可 以从如表1所示的刷卡记录中获取。

将移动电话在移动网络中的第j次位置区更新记录,记为Lj={tj,lj}, 其中tj表示第j次位置区更新的时间,lj表示第j次位置区更新的发生位 置(即更新前位置区和更新后位置区的交叠区域)。

图5显示了两个刷卡记录Si1和Si2,即一个刷卡记录对<Si1,Si2>,表 明一个持有与刷卡记录对相对应的智能卡的用户,在时刻ti1′时在一个地 铁站ri1刷卡进站,在时刻ti2′时又在另一个地铁站ri2刷卡出站。图5还显 示了日志记录中的两个位置区更新记录Lj1和Lj2,表明一个与这两个位置 区更新记录对应的移动电话,在时刻tj1在位置lj1发生位置区更新,然 后又在时刻tj2在位置lj2发生位置区更新。

图5所示的场景,描述了刷卡记录对<Si1,Si2>和位置区更新记录对 <Lj1,Lj2>所反映的事实。直观上看,图5所示的移动电话550与智能卡 510,很可能具有关联关系,即移动电话550的用户就是智能卡510的 用户。

按照本发明,首先从移动电话的日志记录中选择一个位置区更新记 录对,该位置区更新记录对与刷卡记录对在地理位置上重叠。

一般地,刷卡位置ri与位置区更新的发生位置lj之间的对应关系,可 以用一个对应函数来定义:

对于图5所示的例子来说,刷卡位置与位置区更新的发生位置处于相 同的地理位置。于是,计算刷卡记录对<Si1,Si2>和位置更新记录对 <Lj1,Lj2>在时间上的重叠程度,来衡量刷卡记录和位置区更新记录关联 程度。重叠程度越高,关联度越大。

可以用下面的公式(1)计算重叠程度:

F(<Si1,Si2>,<Lj1,Lj2>)=||{ti1,ti2}{tj1,tj2}||||{ti1,ti2}{tj1,tj2}||---(1)

这里{tj1,tj2}表示从时刻tj1到时刻tj2的时间段,范数||{x,y}||表示时刻x到时 刻y的时间差,两个时间段的交集操作(如{ti1′,ti2′}∩{tj1,tj2})表示两个时 间段的交叠部分,两个时间段的并集操作(如{ti1′,ti2′}∪{tj1,tj2})表示两个 时间段占用的总时间,即这两个时间段的长度之和,减去这两个时间段 的交叠部分的长度。例如,ti1′是9:10,ti1′是9:30,则{ti1′,ti2′}表示时间段 9:10到9:30;类似地,tj1是9:11,tj2是9:32,则{tj1,tj2}表示时间段9:11 到9:32。相应地,{ti1′,ti2′}∩{tj1,tj2}表示9:11到9:30的时间段, ||{ti1′,ti2′}∩{tj1,tj2}‖=19分钟;{ti1′,ti2′}∪{tj1,tj2}表示9:10到9:32的时间段, ||{ti1′,ti2′}∪{tj1,tj2}‖=22分钟,则F(<Si1,Si2>,<Lj1,Lj2>)=19/22=0.86。

从公式(1)可以得出,如果两个时间段完全没有重合,则 如果两个时间段完全重合,则

判别刷卡记录和位置区更新记录是否可能关联的判别条件是:

F({Si1,Si2},{Lj1,Lj2})>φ

这里,φ是一个预定的阈值,0<φ<1。φ的大小决定关联准确度和可找到 的关联对。显然,φ越小,能找到的智能卡-移动电话的关联对越多,但 相应的准确度也越低,容易出现误关联;相反,φ越大,找到的关联对 准确度会很高,但能找到的关联对越少。在实际环境中,φ的取值也受 到位置区和蜂窝小区覆盖的范围的影响,在典型的城市环境中φ的取值 范围是0.6-0.9。

按照本发明一个实施例,在前述方法的步骤420中,采用公式(1)计 算刷卡记录对与位置区更新记录对在时间上的重叠程度。

按照本发明的另一个实施例,如果移动电话在两次刷卡之间时段内 进行了连续的通信行为,则可以依据通话过程中产生的时间和位置信息 对智能卡和移动电话进行关联分析。

具体来说,在步骤420计算所述刷卡记录对的刷卡位置和对应的刷 卡时间与所述移动电话的日志记录中记录的移动电话行为的行为位置 和行为时间上的重叠程度时,可以采用下述步骤:

从移动电话的日志记录中选择一个通信行为记录序列,该通信行为 记录序列发生在刷卡记录对的两次刷卡时刻之间;根据刷卡记录对估计 移动电话经过通信行为记录序列中的各蜂窝小区的时刻,计算所估计的 时刻与通信行为记录序列中记录的所述候选移动电话在各蜂窝小区发 生通信行为的实际时刻的平均匹配程度,作为所述刷卡位置和对应的刷 卡时间与所述候选移动电话的日志记录中记录的移动电话行为的行为 位置和行为时间上的重叠程度。

以下结合图6,对该实施例作进一步说明。

图6是基于通信事件进行关联分析的示意图。图6所示的关联场景, 是刷卡记录对{Si1,Si2}与一系列发生在两次刷卡时刻之间的通信行为记 录序列{Ck1,Ck2,...,Ckn}直接的关联。这里,移动网络中的第k次通信 行为记录,记为其中表示第k次通信行为发生的时间,ck表 示通信行为发生时用户所在的蜂窝小区。

与图5所示的关联场景不同,这里刷卡位置并不是与通信行为发生 的位置直接进行关联,而是结合用户(例如在上下车时的)两次刷卡时段 内所乘坐车辆走行的线路,估计用户通过通信行为发生时用户所在小区 的时刻,并用此时刻和用户通信记录中的时刻进行关联。通过查询用户 刷卡记录中的车辆标识可以知道用户所乘坐的车次信息,进而通过查询 车辆运行线路得到用户在两次刷卡时刻之间实际通过的线路。

图6中,用T({Si1,Si2},ck)表示给定一个刷卡记录对{Si1,Si2},用户在中 间通过给定蜂窝小区ck的估计时刻。以下为方便表达,使用“估计时刻” 表示通过刷卡记录估计出来的用户通过给定小区的时刻,使用“实际时 刻”表示移动网络中记录的用户在给定小区发生通信行为的时刻。

相应地,刷卡记录和通信行为记录关联程度可以用通信行为记录序 列中各小区的估计时刻和实际时刻的平均匹配程度来衡量,估计时刻和 时间时刻越接近,关联程度越高。

上述平均匹配程度F,可以使用公式(2)来计算:

F(<Si1,Si2>,<Ck1,Ck2,...,Ckn>)=1n-1Σm=1,2,...,n-1||{T({Si1,Si2},ckm),T({Si1,Si2},ck,m+1)}{tkm*,tk,m+1*}||||{T({Si1,Si2},ckm),T({Si1,Si2},ck,m+1)}{tkm*,tk,m+1*}||...(2)

其中,公式(2)中的运算符含义与与公式(1)的相同,即:“∩”表 示两个时间段的交叠部分、“∪”表示两个时间段占用的总时间,范数 ||{x,y}||表示时刻x到时刻y的时间差。举例来说,一个智能卡刷卡记录对 {Si1,Si2}表明智能卡用户在9:00从375路公交车的西直门站上车,9:45 在五道口站下车,在9:00-9:45之间有一个移动电话产生了三个通信行 为记录{Ck1,Ck2,Ck3},记录中的每个蜂窝小区都在375路公交从西直门 到五道口的线路上。根据375路公交的日常运行速度,我们可以估计出 375路公交通过移动通信记录中的这三个蜂窝小区的时刻分别为9:15、 9:20和9:35。而通信行为记录中的实际时间分布为9:16、9:19和9:34, 则根据公式(2)我们可以得到平均匹配程度为

F(<Si1,Si2>,<Ck1,Ck2,...,Ckn>)=12(3/5+14/16)=0.7375.

判别刷卡记录和通信行为记录是否可能关联的判别条件是:

这里,是一个预定的阈值,的物理含义与上文结合图5 所述的φ类似。φ和的具体取值可以不同,其分别取决于网络中通信小 区的面积大小和位置区更新区域的面积大小。通信小区的面积越大,刷 卡记录和通信行为记录关联的误差容忍范围就越大,相应地的取值应 该越小;类似地,位置区更新区域的面积越大,刷卡记录和位置区更新 记录关联的误差容忍范围就越大,相应地φ的取值应该越小。在典型的 城市环境中的取值范围是0.6-0.9。

按照本发明的一个实施例,在前述方法的步骤420中,采用公式(2) 计算通信行为记录序列中各蜂窝小区的估计时刻和用户在各蜂窝小区 发生通信行为的实际时刻的平均匹配程度。

以上描述的用于识别智能卡与移动电话之间的关联关系的方法的 各种实施例,是将一对智能卡和移动电话作为待匹配对象进行关联分析 的过程。

按照本发明的一个实施例,在具体实施上文所述的用于识别智能卡 与移动电话之间的关联关系的方法的各种实施例时,可以从预定的候选 匹配集合中选定一对智能卡和移动电话,将它们作为待匹配的候选智能 卡和候选移动电话,所述候选匹配集合包含多个二元组,每个二元组表 示一个智能卡和一个移动电话。

按照本发明方法对预定的候选集合中的每对智能卡和移动电话进 行关联分析,就能识别出每对智能卡和移动电话是否关联,由此生成一 个由关联的智能卡-移动手机对组成的关联集合。

可以通过各种方式获得所述候选匹配集合。例如可以将经常在某个 地理区域范围内有刷卡行为的智能卡和在相同的地理区域范围内有通 信行为的移动电话简单地配对,获得候选匹配集合。按照本发明的一个 实施例,可以通过对智能卡和移动电话进行地域关联,获得所述候选匹 配集合。具体来说,可以通过以下步骤生成一个候选匹配集合:

对于给定范围的每个智能卡,比较该智能卡的刷卡记录与给定范 围内的每个移动电话的日志记录,如果在一个时刻智能卡的刷卡与移动 电话的行为发生在相同的地理位置,则将该智能卡标识与移动电话标识 组成的二元组,放入所述候选匹配集合。

按照本发明的实施例,对于候选匹配集合中的每个二元组中的智能 卡和移动电话,如果在一个时刻智能卡的刷卡与移动电话的行为发生在 不同的地理位置,则从候选匹配集合中删除该二元组。

上述生成候选匹配集合所基于的考虑是,如果在某时刻智能卡刷卡 行为与移动电话的行为发生在相同的地点,则智能卡与移动电话可能有 关联。如果在某时刻智能卡刷卡行为与移动电话的行为发生在不同的地 点,则智能卡与移动电话基本上不可能有关联。因此,如此生成的候选 匹配集合是对待匹配的智能卡和移动电话作出的初步筛选结果,其中的 每对智能卡和移动电话的刷卡记录和通信记录在发生地点上是相同或 相近的,采用这样的候选匹配集合用于细粒度的关联分析,显然可以降 低关联分析的计算量。

以上结合实施例说明了本发明的用于识别智能卡与移动电话之间 的关联关系的方法。按照同一个发明构思,本发明也提供一种用于识别 智能卡与移动电话之间的关联关系的系统。

如图7所示,用于识别智能卡与移动电话之间的关联关系的系统 700,包含选择装置710、计算装置720和判断装置730。

对于给定的智能卡和移动电话,选择装置710被配置得可以从智能 卡的刷卡记录集合中选择多个刷卡记录对,其中,所述多个刷卡记录对 中的每条刷卡记录包含刷卡位置和对应的刷卡时间。

计算装置720,用于计算选择装置710所选择的所述刷卡记录对的 刷卡位置和对应的刷卡时间与移动电话的日志记录中记录的移动电话 行为的行为位置和行为时间上的重叠程度。

判断装置730,用于判断刷卡记录对与移动电话的日志记录中记录 的移动电话行为是否重叠,以及判断智能卡与移动电话是否关联。具体 来说,如果计算装置720所计算的重叠程度大于一个预定的阈值,判断 装置730则判定刷卡记录对与该移动电话的日志记录中记录的移动电话 行为重叠;如果所述多个刷卡记录对中的每个刷卡记录对都与该移动电 话的日志记录中记录的移动电话行为重叠,则判定该智能卡与该移动电 话是关联的。

按照本发明一个实施例,所述选择装置710被配置得从所述智能卡 的刷卡记录集合中选择具有不同的刷卡日期的刷卡记录对。

按照本发明一个实施例,所述计算装置710被配置得从移动电话的 日志记录中选择一个位置区更新记录对,该位置区更新记录对与刷卡记 录对在地理位置上重叠;计算刷卡记录对与位置区更新记录对在时间上 的重叠程度,作为所述刷卡位置和对应的刷卡时间与所述移动电话的日 志记录中记录的移动电话行为的行为位置和行为时间上的重叠程度。

按照本发明一个实施例,计算装置710采用前文所述的公式(1) 计算刷卡记录对与位置区更新记录对在时间上的重叠程度。

按照本发明一个实施例,计算装置710被配置得从移动电话的日志 记录中选择一个通信行为记录序列,该通信行为记录序列发生在刷卡记 录对的两次刷卡时刻之间;根据刷卡记录对估计移动电话经过通信行为 记录序列中的各蜂窝小区的时刻,计算所估计的时刻与移动电话在各蜂 窝小区发生通信行为的实际时刻的平均匹配程度,作为所述刷卡位置和 对应的刷卡时间与所述移动电话的日志记录中记录的移动电话的行为 的行为位置和行为时间上的重叠程度。

按照本发明一个实施例,计算装置710采用前文所述的公式(2)计 算通信行为记录序列中各蜂窝小区的估计时刻和移动电话在各蜂窝小 区发生通信行为的实际时刻的平均匹配程度。

按照本发明一个实施例,从预定的候选匹配集合中获得所述智能卡 和移动电话,所述候选匹配集合包含多个二元组,每个二元组表示一个 智能卡和一个移动电话。

按照本发明一个实施例的系统,进一步包含候选匹配集合生成装置 (图中未予示出),对于给定范围的每个智能卡,候选匹配集合生成装 置比较该智能卡的刷卡记录与给定范围内的每个移动电话的日志记录, 如果在一个时刻智能卡的刷卡与移动电话的行为发生在相同的地理位 置,则将该智能卡标识与移动电话标识组成的二元组,放入所述候选匹 配集合。

按照本发明一个实施例,对于候选匹配集合中的每个二元组中的智 能卡和移动电话,如果在一个时刻智能卡的刷卡与移动电话的行为发生 在不同的地理位置,则候选匹配集合生成装置从候选匹配集合中删除该 二元组。

以上描述了根据本发明的实施例。应指出的是,以上描述仅为示例, 而不是对本发明的限制。在本发明的其他实施例中,该方法可具有更多、 更少或不同的步骤,对步骤的编号,是为了使说明更加简明,而不是对 各步骤之间的顺序关系的严格限定,各步骤与步骤之间的顺序可以与所 描述的不同。例如,在本发明的一些实施例中,可以没有上述一个或多 个可选步骤。每个步骤的具体执行方式可以与所描述的不同。所有这些 变化都处于本发明的精神和范围之内。

本发明可以硬件、软件、或硬件与软件的结合的方式实现。本发明 可以集中的方式在一个计算机系统中实现,或以分布方式实现,在这种 分布方式中,不同的部件分布在若干互连的计算机系统中。适于执行本 文中描述的方法的任何计算机系统或其它装置都是合适的。一种典型的 硬件和软件的组合可以是带有计算机程序的通用计算机系统,当该计算 机程序被加载和执行时,控制该计算机系统而使其执行本发明的方法, 并构成本发明的装置。

本发明也可体现在计算机程序产品中,该程序产品包含使能实现本 文中描述的方法的所有特征,并且当其被加载到计算机系统中时,能够 执行所述方法。以上参照优选实施例具体示出和说明了本发明,本领域 技术人员应理解,可在形式和细节上对其进行各种改变而不会背离本发 明的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号