法律状态公告日
法律状态信息
法律状态
2017-10-17
授权
授权
2015-04-01
实质审查的生效 IPC(主分类):H04W16/22 申请日:20141128
实质审查的生效
2015-03-04
公开
公开
技术领域
本发明属于移动通信技术领域,涉及一种移动网络数据流量分析及预测方法,特别是一 种将社会因素与时间序列预测相结合的移动数据流量分析及预测方法。
背景技术
过去几十年里,移动网络以其可移动性、高传输速率、易于扩展和良好的性价比等优势 获得了迅猛的发展,网络中承载的数据业务流量越来越大,业务类型越来越多,流量特性也 越来越复杂。根据Cisco统计,2012年,全球移动数据流量是2000年的12倍,并预测2012 年至2017年里,全球移动数据流量将增长13倍。此外,统计还表明移动流量已经由语音向 多媒体多元化发展,其中视频流量占据全球移动数据总流量的三分之二。
日益增长的网络规模和用户需求给移动网络带来了诸多挑战,其中急剧增长的网络流量 给当前网络架构造成了巨大的压力,同时也降低了用户体验。
网络流量预测是对网络进行有效管理、维护和安全保障的重要手段,通过对历史数据进 行分析,可以了解网络的运营环境以及网络服务状态等方面的情况,为网络的升级和改进提 供必要的参考。然而,随着移动网络的迅速发展,终端设备的不断增多,网络流量数据将呈 现大幅度的增长,网络流量即将迈向大数据时代。在大数据流量背景下,终端业务类型的急 剧增加导致流量性质发生改变,传统的流量预测方法已不适用于当今乃至未来移动网络的分 析与预测。
目前,大多数预测方法仅从微观层面、网络的角度来探究流量特性变化的原因,如,终 端数据包传输机制、多样化业务类型以及其产生的相关协议是导致流量特性变化的重要因素。 然而,随着移动网络的发展,流量变化现象的出现并不局限于此,对于宏观层面分析流量变 化,将流量特性变化与社会因素相关联也是十分必要的。此外,针对流量分析及预测提出的 方法,如基于神经网络的预测方法、小波算法等能够达到较高的预测效果,却因其结构复杂、 参数众多,导致算法收敛速度慢、预测时间较长而无法用于实际网络流量预测中,因此对网 络流量的分析及预测势在必行。
发明内容
有鉴于此,本发明的目的在于提供一种移动网络数据流量分析及预测方法,该方法在传 统时间序列预测原理基础之上,考虑流量特性与社会因素之间的关联性,将流量预测分为工 作日和休息日两个不同的角度进行。
为达到上述目的,本发明提供如下技术方案:
一种移动网络数据流量分析及预测方法,该方法在传统时间序列预测方法的基础之上, 考虑流量特性与社会因素之间的关联性,将流量预测分为工作日和休息日两个不同的角度进 行:针对任意一天工作日的流量预测,采用与这一天相关性最强的两天流量序列进行组合, 并与上一周该天产生的流量序列求平均值,作为工作日流量预测最终模型;针对任意一天休 息日的流量预测,采用对工作日进行流量尺度补偿后,取与这一天相关性最强的五天的流量 序列进行组合,并与上一周该天产生的流量序列求平均值,作为休息日流量预测最终模型。
进一步,该预测方法具体包括以下步骤:
步骤一:对上一周原始流量数据进行采集,形成原始数据集;
步骤二:将原始数据集划分为工作日数据集和休息日数据集;
步骤三:分析工作日数据集和休息日数据集之间的相关性;
步骤四:对于工作日的流量预测,首先,综合考虑工作日与休息日数据集之间的相关性, 根据相关性大小次序,用上一周的流量相关性组合来表征需要预测的时间段的流量,其非连 续时间相关性组合可以表示为:
其中,fi(t)(t=1,2,...,n.i=1,2,...,m)表示在时间t上的组合序列i,yweekdays(t) (t=1,2,...,n)表示fi(t)的序列组合;m个序列的组合向量表示为w=(w1,w2,...,wm),并且满 足下面条件:
eTw=1;w≥0;eT=(1,1,...,1);
步骤五:对于休息日的流量预测,采用补偿因子来减少工作日和休息日产生的流量的尺 度的差别,补偿因子可以由以下公式获得:
其中,fj(t)(j=1,2,...,5.t=1,2,...,n),表示工作日中第j天的序列,fs(t)(t=1,2,...,n) 表示要预测的星期天数在上一周产生的流量序列,p(t)是fj(t)和fs(t)的比值;
步骤六:将得到的补偿因子用于对工作日流量尺度的补偿,从而得到新的流量序列,如 下列公式所给出:
fnew_j(t)=CF(t)·fj(t)
其中,fnew_j(t)表示经过补偿因子修复后得到的工作日流量序列,因此,休息日的非连续时间 相关性组合表示为:
其中,yweekends(t)(t=1,2,...,n)表示相关天数产生的流量相关性组合;
步骤七:通过如下最优模型,得到最佳组合:
其中,fk(t)表示需要预测的序列对应上周工作日的流量值,fs(t)表示需要预测的序列对应上 周休息日的流量值,fA,fB分别表示fk(t)和fs(t)的平均值,yA,yB分别表示yweekdays(t)和yweekends(t) 的平均值;
步骤八:求解得到最优组合向量后,通过以下公式求解流量预测序列:
其中,Pweekdays(t),Pweekends(t)分别表示工作日和休息日流量预测公式。
本发明的有益效果在于:本发明所述方法把社会行为因素与时间序列预测相结合,将流 量预测分为工作日预测和休息日预测两个角度进行,通过最优化求解得到预测公式,从而减 小了非相关天数产生的流量对预测准确性的影响。本方法计算量较低,并能够达到较高的预 测效果。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为重庆移动数据流量获取方式和流量预测系统结构框架;
图2为重庆地区一周流量图;
图3为传统时间序列流量预测基本原理;
图4为改进时间序列流量预测基本原理;
图5为移动流量预测流程图;
图6为非连续时序组合原理图;
图7为一周实际流量之间的相关性;
图8为针对周一预测,六种试验分别得到的最优权值参数;
图9为对一周实际流量进行补偿后的相关性;
图10为针对周日预测,六种试验分别得到的最优权值参数;
图11为针对周一预测,六种试验分别得到的MAPE;
图12为针对周日预测,六种试验分别得到的MAPE;
图13为本发明与基于神经网络方法所得到的一周流量预测效果对照图;
图14为本发明与基于神经网络方法所得到的周一流量预测效果对照图;
图15为本发明与基于神经网络方法所得到的周日流量预测效果对照图;
图16为本发明与基于神经网络方法的MAPE对比。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
本发明采用的数据流量来自重庆移动现网,如图1所示数据集取自DPI分析系统,数据 集涵盖了从接入网到骨干汇聚层的所有数据,从而保证数据的完整性和可靠性。基于现网流 量数据,本发明充分挖掘流量特性与社会因素之间的关联性,具体如图2所示,一周中用户 在休息日(周五至周六)用于移动终端和移动应用程序的时间要明显高于平时工作日(周一 至周五)。同时,工作日中,每天产生的流量彼此之间的相关性要明显高于休息日产生的数据 流量。
为实现上述目的,采取如下技术方案,该发明在图3所示的传统时间序列预测原理基础 之上,考虑流量特性与社会因素之间的关联性,将流量预测分为工作日和休息日两个不同的 角度进行,其原理如图4所示。图5揭示了本发明的具体预测流程图:
1.考虑到工作日和休息日,每天产生的流量分别具有极强的相关性。本发明将流量预测 分为工作日和休息日两个不同的角度进行,从而提高整体预测效果。
2.对于工作日的流量预测,如图6(a)所示,首先用上一周的流量相关性组合来表征需要 预测的时间段的流量。其非连续时间相关性组合可以表示为:
其中,fi(t)(t=1,2,...,n.i=1,2,...,m)表示在时间t上的组合序列i。yweekdays(t) (t=1,2,...,n)表示fi(t)的序列组合。m个序列的组合向量表示为w=(w1,w2,...,wm),并且满 足下面条件:
eTw=1
w≥0
eT=(1,1,...,1).
3.对于休息日的流量预测,考虑到休息日涉及的流量天数有限,如图6(b)所示,该发明 提出使用补偿因子来减少工作日和休息日产生的流量的尺度的差别。补偿因子可以由以下公 式获得:
其中,fj(t)(j=1,2,...,5.t=1,2,...,n)表示工作日中第j天的序列,fs(t)(t=1,2,...,n) 表示要预测的星期天数在上一周产生的序列。p(t)是fj(t)和fs(t)的比值。
4.将得到的补偿因子用于对工作日流量尺度的补偿,从而得到新的流量序列,如下列公 式所给出:
fnew_j(t)=CF(t)·fj(t)
其中,fnew_j(t)表示经过补偿因子修复后得到的工作日流量序列,因此,休息日的非连续时间 相关性组合可以表示为:
其中,yweekends(t)(t=1,2,...,n)表示相关天数产生的流量相关性组合。
5.为了找到最佳组合,该发明提出如下最优模型:
其中,fk(t)表示需要预测的序列对应上周工作日的流量值,fs(t)表示需要预测的序列对应上 周休息日的流量值。fA,fB分别表示fk(t)和fs(t)的平均值。yA,yB分别表示yweekdays(t)和yweekends(t) 的平均值。
6.求解得到最优组合向量后,通过以下公式求解流量预测序列:
其中,Pweekdays(t),Pweekends(t)分别表示工作日和休息日流量预测公式。
实施例:
本发明首先基于重庆移动公司现网流量数据分析得出一周实际流量之间的相关性,如图 7所示,一周中不同的天数之间的相关性不同,工作日或者是休息日彼此之间的相关性明显 高于工作日与休息日之间的相关性。针对以上特点,本发明考虑预测时序列(如周一)与其 他天数之间的相关性,根据相关性次序大小,构建出六个可选择预测组合:
Trial#1:{Tue.};
Trial#2:{Tue.,Thur.};
Trial#3:{Tue.,Wed.,Thur.};
Trial#4:{Tue.,Wed.,Thur.,Fri.};
Trial#5:{Tue.,Wed.,Thur.,Fri.,Sat.};
Trial#6:{Tue.,Wed.,Thur.,Fri.,Sat.,Sun.};
根据之前介绍的工作日流量预测模型,六种可选择预测组合的最优权值参数如图8所示。
考虑到休息日包含的天数较少,本发明提出对工作日流量尺度进行补偿,以增加休息日 与工作日彼此之间的相关性,补偿后的一周流量之间的相关性如图9所示。
本发明考虑预测时序列(如周日)与其他补偿后天数之间的相关性,根据相关性次序大 小,构建出六个可选择预测组合:
Trial#1:{Tue.};
Trial#2:{Tue.,Wed.};
Trial#3:{Tue.,Wed.,Thur.};
Trial#4:{Mon.,Tue.,Wed.,Thur.};
Trial#5:{Mon.,Tue.,Wed.,Thur.,Fri.};
Trial#6:{Mon.,Tue.,Wed.,Thur.,Fri.,Sat.};
根据之前介绍的休息日流量预测模型,六种可选择预测组合的最优权值参数如图10所 示。
为了验证移动流量预测效果,本发明采用平均绝对百分比误差(MAPE)作为衡量指标, 其表达式如下:
由上述表达式,可分别计算周一和周日六种可选择预测组合的MAPE,如图11和图12所 示。针对周一流量预测,由图11可知,其最佳预测时序组合:与周一相关性最强的两天流量 序列组合。针对周日流量预测,由图12可知,其最佳预测时序组合:对一周流量进行补偿后, 与周日相关性最强的五天流量序列组合。考虑到工作日或者是休息日彼此之间具有较强的相 关性,由此得出,针对任意一天工作日的流量预测,我们可以用与这一天相关性最强的两天 流量序列进行组合,并与上周该天产生的流量序列求平均,作为工作日流量预测最终模型。 针对任意一天休息日的流量预测,我们可以对工作日进行流量尺度补偿后,取与这一天相关 性最强的五天的流量序列进行组合,并与上周该天产生的流量序列求平均,作为休息日流量 预测最终模型。因此,可以进行一周流量预测。
图13显示了该发明与基于神经网络方法所得到的一周流量预测效果对照图,图14和图 15分别为周一和周日流量预测中,该发明与基于神经网络方法所得到的流量预测效果对照图。 可以看出,对比基于神经网络方法所得到的流量预测,本发明可以获得更好的预测效果。
图16显示了该发明与基于神经网络方法的MAPE对比。如图可以看出,针对工作日流量 预测,在神经网络方法预测基础之上本发明的MAPE降低了35.7%;针对休息日流量预测,在 神经网络方法预测基础之上本发明的MAPE降低了43.8%。
由此可见,本发明提出的流量预测方法能够有效控制系统计算量,同时达到较高的预测 效果。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述 优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和 细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
机译: 一种数据流量管制的方法,一种实现这种数据流量管制的方法以及一种包括这种数据流量管制员的电信网络
机译: 一种基于运动方向的移动网络中用户设备单元选择合适候选者的预测方法
机译: 一种数据流量监管方法,一种实现这种数据流量策略的方法以及一种包括这种策略的电信网络