首页> 中国专利> 基于复杂网络理论的移动网络流量模式挖掘方法

基于复杂网络理论的移动网络流量模式挖掘方法

摘要

本发明公开了一种基于复杂网络理论的移动网络流量模式挖掘方法,包括确定待分析区域并栅格化划分;获取待分析区域内的原始移动网络流量数据;进行栅格内流量聚合得到各个栅格的流量数据;提取各个栅格的流量数据的流量特征;以栅格作为网络节点构建栅格关系网络;采用基于复杂网络理论的社区挖掘方法对栅格关系网络进行社区挖掘,得到流量模式相似的空间区域集合,完成移动网络流量模式挖掘。本发明能够在不具备先验知识的条件下完成对移动网络流量数据的聚类分析,同时兼顾了数据的群体性行为特征;因此本发明方法的可靠性高、实用性好且效果较好。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-02

    实质审查的生效 IPC(主分类):G06F16/2458 专利申请号:2022106251262 申请日:20220602

    实质审查的生效

说明书

技术领域

本发明属于移动通信技术领域,具体涉及一种基于复杂网络理论的移动网络流量模式挖掘方法。

背景技术

随着经济技术的发展和人们生活水平的提高,移动通信技术已经广泛应用于人们的生产和生活当中,给人们的生产和生活带来了无尽的便利。

随着移动通信技术的发展,移动网络用户数量不断增加,移动通信流量呈爆炸式增长。这些移动网络流量数据包含了大量信息,从一定程度上反映了用户的个体行为和群体行为特征,有助于研究人员理解真实世界的物理现象。若能够挖掘出隐藏在流量数据背后的信息,则可以为人类生活提供更多的便利。如通过对移动网络流量反映的城市热点地区进行分析,可为通信基站选址、电力基础设施建设等提供重要参考;又如通过对不同类型移动网络流量特点及其反映的用户分布规律进行分析,可为不同区域的网络切片资源配置提供重要依据。

模式挖掘是从大量目标数据中提取典型行为的过程,其主要手段为聚类分析;而现阶段对移动网络流量的聚类分析多采用有监督、无监督或半监督的机器学习算法。现有算法多以研究对象相互独立为前提,把流量数据当作静态、孤立的时间序列处理,不仅忽略了对象之间的联系,还缺乏对群体性行为特征的剖析。同时,基于机器学习的方法需要一定的人工先验知识,存在一定局限性。

发明内容

本发明的目的在于提供一种可靠性高、实用性好且效果较好的基于复杂网络理论的移动网络流量模式挖掘方法。

本发明提供的这种基于复杂网络理论的移动网络流量模式挖掘方法,具体包括如下步骤:

S1.确定待分析区域,并将确定的待分析区域进行栅格化划分;

S2.获取待分析区域内的原始移动网络流量数据;

S3.根据步骤S1的栅格划分结果,对步骤S2中获取的数据进行栅格内流量聚合,得到各个栅格的流量数据;

S4.提取各个栅格的流量数据的流量特征;

S5.以栅格作为网络节点,根据步骤S5得到的各个栅格的流量特征构建栅格关系网络;

S6.采用基于复杂网络理论的社区挖掘方法,对步骤S5构建的栅格关系网络进行社区挖掘,得到流量模式相似的空间区域集合,完成最终的移动网络流量模式挖掘。

步骤S1所述的将确定的待分析区域进行栅格化划分,具体为将确定的待分析区域,划分为边长为设定值的正方形栅格,并用数字进行标识。

步骤S2所述的获取待分析区域内的原始移动网络流量数据,具体为获取每个栅格空间所采集的CDR(Call Detail Records,呼叫详细记录)数据块;每个数据块的时间粒度为X分钟;X为设定的正数。

所述的CDR数据块,具体包括在时间粒度内发起的SMS(Short MessagingService,短消息业务)数据、接收的SMS数据、发起的电话数据、接收的电话数据和互联网流量数据。

步骤S3所述的根据步骤S1的栅格划分结果,对步骤S2中获取的数据进行栅格内流量聚合,得到各个栅格的流量数据,具体为将获取的CDR数据块,按照设定的时间粒度进行聚合,并将聚合后的数据作为对应栅格内的流量数据。

所述的聚合,具体为将获取的CDR数据块流量数据相加。

步骤S4所述的提取各个栅格的流量数据的流量特征,具体包括如下步骤:

采用典型周特征表示方法,在每个栅格中选取一周的流量数据作为对应栅格的特征流量。

步骤S5所述的以栅格作为网络节点,根据步骤S5得到的各个栅格的流量特征构建栅格关系网络,具体包括如下步骤:

以栅格作为网络节点,以栅格间的流量模式相关性作为权重,采用阈值筛选法添加网络连边;

具体实施时,对于任意的栅格i和栅格j,若栅格i的特征流量和栅格j的特征流量之间的相关系数大于设定的阈值,则在栅格i和栅格j之间添加一条有权无向边;最终得到栅格关系网络。

步骤S6所述的采用基于复杂网络理论的社区挖掘方法,对步骤S5构建的栅格关系网络进行社区挖掘,得到流量模式相似的空间区域集合,具体包括如下步骤:

A.初始化各节点的社区:自底向上,将每个节点均初始化为各自的社区;此时,社区数与节点数相等;

B.针对每一个节点,均进行如下步骤:

对当前节点i的每个邻居节点j,采用如下算式计算将节点i划分到社区C

式中ΔQ

计算完成后,再进行判断:

若网络最大模块度增益大于0,则将当前节点i划分到对应的邻居社区;

否则,不改变网络结构;

C.针对每一个社区中的每一个节点,均进行如下步骤:

对节点i的邻居社区C

式中ΔQ为将节点i从社区C

计算完成后,再进行判断:

若网络最大节点迁移模块度增益大于0,则将节点i从社区C

否则,不改变网络结构;

D.重复步骤B~C,直至网络结构不再变化;此时网络的模块度最大;

E.构建新网络:新网络中的每个节点由步骤D中的社区组成,节点间连边权重为社区间所有连边的权重之和,从而构建网络连边;然后,忽略社区内部结构,将得到的网络视为每个节点各成一个社区的新网络;

F.重复步骤B~E,直至网络结构不再变化且不再产生新网络;最终得到移动网络流量模式相似的空间集合。

本发明提供的这种基于复杂网络理论的移动网络流量模式挖掘方法,将移动网络流量的频繁模式挖掘问题转化为社区结构挖掘问题,用一种复杂网络理论中的社区结构挖掘方法来挖掘移动网络流量的频繁模式,能够在不具备先验知识的条件下完成对移动网络流量数据的聚类分析,同时兼顾了数据的群体性行为特征;因此本发明方法的可靠性高、实用性好且效果较好。

附图说明

图1为本发明方法的方法流程示意图。

图2为本发明方法的实施例的城市米兰移动网络流量模式挖掘结果示意图。

图3为本发明方法的实施例的流量模式相似的空间区域集合中的办公区结果示意图。

图4为本发明方法的实施例的流量模式相似的空间区域集合中的休闲区结果示意图。

图5为本发明方法的实施例的流量模式相似的空间区域集合中的住宅区结果示意图。

图6为本发明方法的实施例的流量模式相似的空间区域集合中的交通区结果示意图。

图7为本发明方法的实施例的流量模式相似的空间区域集合中的郊区结果示意图。

具体实施方式

如图1所示为本发明方法的方法流程示意图:本发明提供的这种基于复杂网络理论的移动网络流量模式挖掘方法,具体包括如下步骤:

S1.确定待分析区域,并将确定的待分析区域进行栅格化划分;具体为将确定的待分析区域,划分为边长为设定值(优选为200m)的正方形栅格,对划分好的栅格按照从左至右、从下至上的规则,用数字以从小到大的顺序进行标识;

S2.获取待分析区域内的原始移动网络流量数据;具体为获取每个栅格空间所采集的CDR(Call Detail Records,呼叫详细记录)数据块;每个数据块的时间粒度为X分钟;X为设定的正数;CDR数据块具体包括在时间粒度内发起的SMS(Short Messaging Service,短消息业务)数据、接收的SMS数据、发起的电话数据、接收的电话数据和互联网流量数据;

S3.根据步骤S1的栅格划分结果,对步骤S2中获取的数据进行栅格内流量聚合,得到各个栅格的流量数据;具体为将获取的CDR数据块,按照设定的时间粒度(优选为60min)进行聚合,并将聚合后的数据作为对应栅格内的流量数据;

具体实施时,聚合为将获取的CDR数据块流量数据相加;

S4.提取各个栅格的流量数据的流量特征;具体包括如下步骤:

目前较为前沿的移动网络流量特征表示方法有3种,工作日-周末特征(Weekday-Weekend Signature,WWS),时间跨度为2天;典型周特征(Typical Week Signature,TWS),时间跨度为1周;周期序列特征(Seasonal Communication Series,SCS),时间跨度为1个月;本申请采用典型周特征表示方法,在每个栅格中选取一周的流量数据作为对应栅格的特征流量,具体来说是每个栅格中1周的数据块流量数据随时间的变化特征;

S5.以栅格作为网络节点,根据步骤S5得到的各个栅格的流量特征构建栅格关系网络;以栅格作为网络节点,以栅格间的流量模式相关性作为权重,采用阈值筛选法添加网络连边;具体包括如下步骤:

以栅格作为网络节点,以栅格间的流量模式相关性作为权重,采用阈值筛选法添加网络连边;

具体实施时,对于任意的栅格i和栅格j,若栅格i的特征流量和栅格j的特征流量之间的相关系数大于设定的阈值,则在栅格i和栅格j之间添加一条有权无向边;最终得到栅格关系网络;

S6.采用基于复杂网络理论的社区挖掘方法,对步骤S5构建的栅格关系网络进行社区挖掘,得到流量模式相似的空间区域集合,完成最终的移动网络流量模式挖掘;

具体包括如下步骤:

A.初始化各节点的社区:自底向上,将每个节点均初始化为各自的社区;此时,社区数与节点数相等;

B.针对每一个节点,均进行如下步骤:

对当前节点i的每个邻居节点j,采用如下算式计算将节点i划分到社区C

式中ΔQ

计算完成后,再进行判断:

若网络最大模块度增益大于0,则将当前节点i划分到对应的邻居社区;

否则,不改变网络结构;

C.针对每一个社区中的每一个节点,均进行如下步骤:

对节点i的邻居社区C

式中ΔQ为将节点i从社区C

计算完成后,再进行判断:

若网络最大节点迁移模块度增益大于0,则将节点i从社区C

否则,不改变网络结构;

D.重复步骤B~C,直至网络结构不再变化;此时网络的模块度最大;

E.构建新网络:新网络中的每个节点由步骤D中的社区组成,节点间连边权重为社区间所有连边的权重之和,从而构建网络连边;然后,忽略社区内部结构,将得到的网络视为每个节点各成一个社区的新网络;

F.重复步骤B~E,直至网络结构不再变化且不再产生新网络;最终得到移动网络流量模式相似的空间集合。

以下结合一个实施例,对本发明方法进行进一步说明:

图2为本发明方法在城市米兰2013年11月4日-12月1日期间产生的部分区域CDR数据块上应用所得到的结果。可以看出,应用本发明所提方法,对城市米兰的移动网络流量数据进行模式挖掘可以得到5个流量模式相似的空间区域集合。

在以上结果的基础上,将每种空间区域集合对应到城市米兰地图中,得到图3~7表示的每种区域的覆盖情况,如果非要给这些区域进行分类,那么根据城市米兰实际情况,可以大约分为办公区、休闲区、住宅区、交通区以及郊区。图3示出了办公区流量模式挖掘结果在地图上的表示;图4示出了休闲区流量模式挖掘结果在地图上的表示;图5示出了住宅区流量模式挖掘结果在地图上的表示;图6示出了交通区流量模式挖掘结果在地图上的表示;图7示出了郊区流量模式挖掘结果在地图上的表示;该结果可进一步为通信基站选址、电力基础设施建设、区域网络切片资源配置提供参考。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号