首页> 中国专利> 一种基于韦布尔分布的网络流量建模方法和系统

一种基于韦布尔分布的网络流量建模方法和系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种基于韦布尔分布的网络流量建模方法和系统，包括以下步骤：步骤1：产生预定数量的韦布尔噪声时间序列a

著录项

公开/公告号CN105978733A

专利类型发明专利
公开/公告日2016-09-28

原文格式PDF
申请/专利权人华北理工大学;
展开▼

申请/专利号CN201610481911.X
发明设计人孙晓川;李莹琦;耿大猛;张明辉;
展开▼

申请日2016-06-27
分类号
代理机构北京轻创知识产权代理有限公司;
代理人杨立
地址 063009 河北省唐山市新华西道46号
入库时间 2023-06-19 00:34:22

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-16

授权

授权
2016-10-26

实质审查的生效 IPC(主分类):H04L12/24 申请日:20160627

实质审查的生效
2016-09-28

公开

公开

说明书

技术领域

本发明涉及网络通信领域，尤其涉及一种基于韦布尔分布的网络流量建模方法和系统。

背景技术

在计算机网络的设计、评价和优化中，网络流量建模起着非常重要的作用。其中，以统计分布理论作为研究网络业务的基础，促进了网络流量业务的发展，网络业务的自相似性和突发性对网络的分析、设计、控制和管理产生了巨大影响，对网络的服务质量提出了更严峻的挑战。网络性能评价就成为网络设计与控制的重要研究部分，尤其随着网络的发展，网络上承载的业务也由语音扩展到视频，多媒体等，这一切都对网络性能和网络业务建模提出了更高的要求，因此建立出合理的网络流量模型对于网络的发展起着至关重要的作用。

实际的网络数据在绝大部分时间尺度范围内具有统计的自相似性，在小尺度范围内具有突发性。统计分布理论作为研究网络业务的工具为建模研究提供了便利。传统的网络流量模型在描述实际网络业务时，认为网络模型具有Markov性，并在此基础上建立了以泊松过程为主的数学描述模型。但此模型只可以描述突发的特征，并不能很好得描述出实际网络业务自相似性的特点；随后，科学家又进行了大量的仿真实验，应用了大量的数学模型，比如：Markov过程、AR、MA、ARMA和ARIMA过程等，同样这些模型不能很好地描述网络业务的自相似的特性，因此建立可以同时描述自相似性和突发性的网络业务模型是很有必要的。随着科学研究的发展，FARIMA(分数差分自回归滑动平均过程)被用作为网络业务模型，该模型以统计分布理论中的高斯噪声为基础成功地得到了可以描述网络流量的自相似性和突发性质的模型。但是，这种模型在某种程度上是有缺陷的，比如：在一个单一的Hurst参数下，这种模型很难去描述整个时间序列的相关性，况且，在实际的网络流量建模时，这类的自相似过程是比较片面的。

发明内容

本发明所要解决的技术问题是提供一种基于韦布尔分布的网络流量建模方法和系统，用韦布尔分布代替高斯分布生成的FARIMA模型比传统的网络流量模型更精确，更符合实际的网络流量的波形图，自相似的程度更好。

本发明解决上述技术问题的技术方案如下：一种基于韦布尔分布的网络流量建模方法，包括以下步骤：

步骤1：产生预定数量的韦布尔噪声时间序列a_t；

步骤2：对产生的韦布尔噪声时间序列a_t进行预处理，剔除异点，并进行零均值化处理得到韦布尔时间序列ε_t；

步骤3：采用搜索法估计分数差分系数d；

步骤4：根据分数差分系数d对步骤2的韦布尔时间序列εt应用分数差分公式进行差分滤波得到时间序列W_t；

步骤5：对时间序列W_t进行ARMA过程，得FARIMA时间序列X_t；

步骤6：验证产生的FARIMA时间序列X_t能够描述网络流量的自相似性和突发性。

本发明的有益效果：用韦布尔分布代替高斯分布生成的FARIMA模型准确地描述了实际网络流量业务的自相似性和突发性，比传统的网络流量模型更精确，更符合实际的网络流量的波形图，自相似的程度更好。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述步骤1中的韦布尔分布噪声序列由韦布尔分布的概率密度公式产生，所述概率密度公式为：

$f (t; λ, k) = (\begin{matrix} \frac{k}{λ} {(\frac{t}{λ})}^{k - 1} e^{- {(t / λ)}^{k}} & t \geq 0 \\ 0 & t < 0 \end{matrix})$

其中，λ＞0是尺度参数，k＞0是形状参数，t是为韦布尔噪声时间点。

进一步，所述步骤4的分数差分公式为：

$W_{t} = \frac{1}{{(1 - z^{- 1})}^{d}} ϵ_{t} = Σ_{j = 0}^{\infty} π_{j} ϵ_{t - j}$

其中，d∈(-0.5,0.5)，0<|z|＜1，ε_t是韦布尔时间序列，(1-z^-1)^d表示分数差分算子，W_t是对韦布尔序列ε_t做分数差分滤波后得到的序列，0≤t≤1000。

进一步，所述步骤5具体包括以下步骤：

步骤5.1：由Yule-Walker方程计算出AR模型的自回归参数向量和MA模型的滑动平均参数向量θ[θ₁，θ₂，…，θ_q]；

步骤5.2：根据AIC准则求得AR模型和MA模型的自回归系数p与滑动平均系数q；

步骤5.3：将步骤5.1中得到的和θ[θ₁，θ₂，…，θ_q]以及步骤5.2得到的P和q的值代入如下公式：

X_t为FARIMA时间序列，Φ(z-1)和Θ(z-1)分别是p阶自回归多项式和q阶移动平均多项式，W_t是根据差分系数d差分滤波后的时间序列，t为韦布尔噪声时间点，0≤t≤1000。

进一步，所述AIC准则的计算式为：

$A I C (p) = l n {\hat{σ}}^{2} + 2 p / N$

$A I C (q) = l n {\hat{σ}}^{2} + 2 q / N$

其中，N为FARIMA时间序列的时间点容量，p和q为ARMA模型阶数，为差分过后得到的时间序列W_t的残差方差。

进一步，所述步骤6具体包括以下步骤：

步骤6.1:对FARIMA时间序列X_t应用R/S公式来描述X_t自相似的程度，公式为：

$\frac{R (n)}{S (n)} = \frac{1}{S (n)} [\underset{0 \leq t \leq n}{m a x} (X (t) - \frac{t}{n} X (t)) - \min_{0 \leq t \leq n} (X (t) - \frac{t}{n} X (n))]$

其中，R(n)为FARIMA时间序列X_t的极差，S(n)为FARIMA时间序列X_t的标准差，0≤n≤1000，X(t)为FARIMA时间序列X_t；

步骤6.2：根据R/S统计的计算式，在对数坐标下，绘制R/S曲线；

步骤6.3：对R/S曲线进行最小二乘拟合，得到Hurst指数的估计值H；

步骤6.4：当0≤H≤0.5时，认为时间序列不具有自相似性质；0.5<H<1时，说明时间序列有自相似性，并且H的值越接近1，表示自相似程度越好。

步骤6.5：根据FARIMA时间序列X_t波形图观察每个顶端突出部分的差异性判断突发性强弱。

一种基于韦布尔分布的网络流量建模系统，其特征在于，包括数据获取单元、零均值处理单元、估算单元、分数差分单元、ARMA单元及验证单元，

所述数据获取单元，用于产生韦布尔噪声时间序列；

所述零均值处理单元，用于对产生的韦布尔噪声时间序列进行预处理，剔除异点并进行零均值化得到韦布尔时间序列；

所述估算单元，用于采用搜索法估计分数差分系数；

所述分数差分单元，根据分数差分系数对韦布尔时间序列进行分数差分滤波得到差分时间序列；

所述ARMA单元，用于对差分时间序列进行ARMA过程，得FARIMA时间序列；

所述验证单元，用于验证产生的FARIMA时间序列能够描述网络流量的自相似性和突发性。

进一步，所述数据获取单元通过概率密度公式产生韦布尔噪声时间序列，所述概率密度公式为：

$f (t; λ, k) = (\begin{matrix} \frac{k}{λ} {(\frac{t}{λ})}^{k - 1} e^{- {(t / λ)}^{k}} & t \geq 0 \\ 0 & t < 0 \end{matrix})$

其中，λ＞0是尺度参数，k＞0是形状参数，t是韦布尔噪声时间点。

进一步，所述分数差分单元通过分数差分公式对韦布尔时间序列进行分数差分，所述分数差分公式为：

$W_{t} = \frac{1}{{(1 - z^{- 1})}^{d}} ϵ_{t} = Σ_{j = 0}^{\infty} π_{j} ϵ_{t - j}$

$π_{0} = 1, π_{j} = \frac{j - 1 - d}{j} π_{j - 1}, j = 0, 1, 2, ..., \infty$

其中，(1-z^-1)^d表示分数差分算子，ε_t是韦布尔时间序列，W_t是根据差分系数d差分后的时间序列，0≤t≤1000。

附图说明

图1是本发明的方法流程图；

图2是本发明的韦布尔噪声图；

图3是基于韦布尔分布的FARIMA模型波形图；

图4是基于韦布尔分布自相似性Hurst指数图；

图5是高斯噪声图；

图6是基于高斯分布的FARIMA模型波形图；

图7是基于高斯分布的自相似性Hurst指数图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，一种基于韦布尔分布的网络流量建模方法，包括以下步骤：

步骤1：由韦布尔分布的概率密度公式产生1000点布尔噪声序列a_t，如图2所示，用以作为FARIMA模型的基础序列，所述概率密度公式为：

$f (t; λ, k) = (\begin{matrix} \frac{k}{λ} {(\frac{t}{λ})}^{k - 1} e^{- {(t / λ)}^{k}} & t \geq 0 \\ 0 & t < 0 \end{matrix})$

其中，λ＞0是尺度参数，k＞0是形状参数，t是韦布尔噪声时间点。

步骤2：对产生的韦布尔噪声时间序列进行预处理，剔除异点及零均值化得到韦布尔时间序列ε_t；

步骤3：采用搜索法估计分数差分系数d；

步骤4：应用分数差分系数d对步骤2的韦布尔时间序列ε_t进行分数差分得到FARIMA(0，d,0)时间序列W_t，分数差分过程就是将一个时间序列转化为平稳序列所进行的过程，差分系数用d表示，针对韦布尔分布时间序列，我们用搜索法进行估计得到d＝0.15。

其分数差分公式为：

$W_{t} = \frac{1}{{(1 - z^{- 1})}^{d}} ϵ_{t} = Σ_{j = 0}^{\infty} π_{j} ϵ_{t - j}$

$π_{0} = 1, π_{j} = \frac{j - 1 - d}{j} π_{j - 1}, j = 1, 2, ..., \infty$

其中，(1-z^-1)^d表示分数差分算子，ε_t是韦布尔时间序列，W_t是根据差分系数d差分后的时间序列，0≤t≤1000。

步骤5：根据ARMA模型对FARIMA(0，d,0)时间序列W_t进行预测，得到FARIMA(p,d,q)时间序列X_t，其具体过程如下：

(1)由Yule-Walker方程计算出AR模型的自回归参数向量和MA模型的滑动平均参数向量θ[θ1，θ2，…，θq]；

(2)根据AIC准则求得AR模型和MA模型的自回归系数p与滑动平均系数q的值，其AIC准则的计算式为：

$A I C (p) = l n {\hat{σ}}^{2} + 2 p / N$

$A I C (q) = l n {\hat{σ}}^{2} + 2 q / N$

其中，N为FARIMA(0，d,0)时间序列的时间点容量，p和q为ARMA模型阶数，为差分过后得到的FARIMA(0，d,0)时间序列W_t的残差方差。

(3)将步骤(1)中得到的和θ[θ₁，θ₂，…，θ_q]以及步骤(2)得到的P和q的值代入公式：

其中Φ(z^-1)和Θ(z^-1)分别是p阶自回归(AR)多项式和q阶滑动平均(MA)多项式，X_t为FARIMA(p,d,q)时间序列，W_t是根据差分系数d差分后的序列，t为韦布尔噪声时间点，0≤t≤1000，如图3所示。

步骤6：验证产生的基于韦布尔分布的FARIMA(p,d,q)时间序列能够描述网络流量的自相似性和突发性。

对步骤5产生的FARIMA(p,d,q)时间序列应用R/S分析方法，计算公式如下：

$\frac{R (n)}{S (n)} = \frac{1}{S (n)} [\underset{0 \leq t \leq n}{m a x} (X (t) - \frac{t}{n} X (n)) - \min_{0 \leq t \leq n} (X (t) - \frac{t}{n} X (n))]$

其中，R(n)为FARIMA(p,d,q)时间序列X_t的极差，S(n)为FARIMA(p,d,q)时间序列X_t的标准差，n为样本点容量，X(n)为FARIMA(p,d,q)时间序列X_t；

(2)根据R/S统计的计算式，在对数坐标下，绘制R/S曲线，如图4所示；

(3)对R/S曲线进行最小二乘拟合，得到Hurst指数的估计值H，经计算H＝0.8079；

(4)当0.5＜H＜1时，说明时间序列有自相似性；当0≤H≤0.5时，认为时间序列不具有自相似性质，H＝0.8079，说明模型产生了自相似程度较好的时间序列，可以描述网络流量业务的自相似特性。

(5)根据步骤5产生的FARIMA(p,d,q)时间序列X_t波形图观察波形图每个顶端突出部分的差异性判断突发性强弱，观察发现波形图的尖端部分差异性较大，故该模型可以描述网络流量的突发性。

将基于韦布尔噪声的FARIMA模型与传统的基于高斯噪声的FARIMA模型对比，如图5所示为产生的1000点高斯分布噪声图，基于高斯分布的FARIMA模型如图6所示，其自相似性Hurst指数图如图7所示，经计算H＝0.7452，该值小于基于本发明提出模型的Hurst参数值，所以本发明提出的模型产生了高度的自相似时间序列；对比图3与图6，本发明提出的模型波形图比基于高斯分布的模型波形图突发更加明显，因此，本发明提出的网络流量建模方法弥补了传统模型在描述网络流量业务时存在的不足，可以应用到实际的网络评价、优化领域中。

一种基于韦布尔分布的网络流量建模系统，其特征在于，包括数据获取单元、零均值处理单元、估算单元、分数差分单元、ARMA单元及验证单元，

所述数据获取单元，用于产生韦布尔噪声时间序列；

所述零均值处理单元，用于对产生的韦布尔噪声时间序列进行预处理，剔除异点并进行零均值化得到韦布尔时间序列；

所述估算单元，用于采用搜索法估计分数差分系数；

所述分数差分单元，根据分数差分系数对韦布尔时间序列进行分数差分滤波得到差分时间序列；

所述ARMA单元，用于对差分时间序列进行ARMA过程，得FARIMA 时间序列；

所述验证单元，用于验证产生的FARIMA时间序列能够描述网络流量的自相似性和突发性。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于韦布尔分布的网络流量建模方法和系统 [P] . 中国专利： CN105978733B . 2019.04.16
2. 一种基于分布式系统的数据中心网络流量建模方法 [P] . 中国专利： CN107896160B . 2019.07.23
3. BEHAVIOR PATTERN MODELLING SYSTEM OF NETWORK TRAFFIC FOR BOTNET DETECTING AND BEHAVIOR PATTERN MODELLING METHOD OF NETWORK TRAFFIC FOR BOTNET DETECTING [P] . 韩国专利： KR101084681B1 . 2011-11-22

机译：侦查网络流量的行为模式建模系统及侦查网络流量的行为模式建模方法
4. BEHAVIOR PATTERN MODELLING SYSTEM OF NETWORK TRAFFIC FOR BOTNET DETECTING AND BEHAVIOR PATTERN MODELLING METHOD OF NETWORK TRAFFIC FOR BOTNET DETECTING [P] . 韩国专利： KR20110070161A . 2011-06-24

机译：侦查网络流量的行为模式建模系统及侦查网络流量的行为模式建模方法
5. A METHOD FOR THE DETECTION OF NETWORK TRAFFIC ANOMALIES BY THE ENTROPY OF DESTINATION NETWORK DISTRIBUTIONS [P] . 韩国专利： KR20070000728A . 2007-01-03

机译：一种基于目的地网络分布熵的网络流量异常检测方法