首页> 中国专利> 一种信息中心网络ICN中数据源解析方法

一种信息中心网络ICN中数据源解析方法

摘要

本发明涉及一种信息中心网络ICN中数据源解析方法,其采用注册-发现机制:节点存储目标内容或服务器产生内容时,都需要告诉解析服务器;利用BloomFilter技术,Interest查询数据源解析系统就可以得到目标内容的全部数据源的位置。借鉴Q学习的思想,本发明设计的数据源解析系统是自适应的:存储机制初步确定存储内容的承诺时间,如果承诺时间大于最低门限,则注册,并确定其在解析系统中的级别;否则不注册。同时利用解析系统收到的请求解析目标内容的数量和变化趋势推测其处于生命周期中的阶段,进而可帮助更新名字在解析系统中的级别及内容的存储承诺时间。本发明可从存在着多数据源的ICN网络中快速地发现有效数据源,并进一步增强ICN对移动性的支持。

著录项

  • 公开/公告号CN105025111A

    专利类型发明专利

  • 公开/公告日2015-11-04

    原文格式PDF

  • 申请/专利权人 广州大学;

    申请/专利号CN201510485971.4

  • 发明设计人 刘外喜;吴颢;蔡君;胡晓;

    申请日2015-08-10

  • 分类号H04L29/08;G06F17/30;

  • 代理机构广州凯东知识产权代理有限公司;

  • 代理人罗丹

  • 地址 510000 广东省广州市番禺广州大学城外环西路230号

  • 入库时间 2023-12-18 11:42:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-09

    授权

    授权

  • 2015-12-02

    实质审查的生效 IPC(主分类):H04L29/08 申请日:20150810

    实质审查的生效

  • 2015-11-04

    公开

    公开

说明书

技术领域

本发明涉及一种信息中心网络ICN中数据源解析方法。

背景技术

为了从根本上解决当前互联网在移动性的支持、可扩展性、安全可控性 等方面存在的问题,设计全新未来互联网架构逐渐成为了研究者们的共识。 近年来,国外针对全新未来互联网的设计启动了各种研究项目,我国对此也 启动了2个973计划项目,各种新架构被提出。

其中,信息中心网络(Information-Centric Networking,简称ICN)是各种以 信息为中心的架构的统称,其具有以信息为中心的通信模式、基于全网缓存 的信息分发模式、内在地支持移动性、内在的安全机制等特点。

同时,据Cisco公司统计,全球网络流量在过去5年中增长了4倍。2012 年~2017年期间,网络流量仍将以23%的年均复合增长率高速增长,其中,大 部分流量都将源自内容获取类应用。互联网应用正由发送者驱动的端对端通 信模式向接收者驱动的海量内容获取模式转变。

当前,应对上述需求挑战的主要方法是基于覆盖网方式的P2P和 CDN(Content Distribution Networks),但它们都处于应用层,会分别遭遇逻辑 拓扑与物理拓扑失配、预规划和实际动态需求失配等问题。然而,网络层多 源传输通过在网络层对用户需求、资源供应、网络传输性能的观察与匹配, 可克服上述问题进而提高传输效率,因此,其将是满足上述需求挑战的一种 有效方案。

在ICN中,每个网络节点都具备存储功能,这种全网缓存机制使得内容 快速地扩散到网络中。在ICN的以接收者驱动的通信模式中,当用户请求某 一内容时,任何缓存有该内容的中间节点都可以做出响应,而不一定都要把 请求发送到原始的内容服务器那里。所以,对于每一个请求,网络都可以提 供多个数据源。现在关键问题是如何让多个数据源协同工作,共同完成一个 数据传输的任务:既要避免数据的重复冗余又要避免遗漏,使多数据源的优 势得以充分地发挥出来,而这其中的首要问题是如何快速地发现数据源。

发明内容

本发明正是针对这一关键问题提出的解决机制。具体而言是提供了一种 信息中心网络ICN中数据源解析方法,为实现上述目的本发明的具体方案如 下:

一种信息中心网络ICN中数据源解析方法,包括以下步骤:

注册:节点存储了目标内容后,向解析服务器报告自己存储的内容以及 承诺存储的时间;内容服务器产生内容的时候,也需要告诉解析服务器,内 容服务器存储该内容的时间是永久的;

发现:内容完成注册后,利用Bloom Filter技术,Interest查询数据源解析 系统得到目标内容的全部数据源的位置。

优选的,在所述注册步骤中,只有流行度高的内容,即在网络中的生命 周期较长的大内容才会向解析服务器注册。

优选的,借鉴Q学习的思想,所述的数据源解析系统是自适应的,其采用 基于内容流行度的分级结构,并且级别可轮换;

首先,存储机制初步确定存储内容的承诺时间;然后,如果承诺时间大 于最低门限,则注册,并确定其在解析系统中的级别,否则,不注册;同时, 利用解析系统收到的请求解析目标内容的数量和变化趋势推测其处于生命周 期中的阶段,进而帮助更新内容的名字在解析系统中的级别以及存储承诺时 间。

优选的,自适应地确定注册时间粒度:首先,按照最低门限进行注册; 然后,让解析系统根据用户的需求不断地进行筛选,使得那些真正受欢迎的 内容会在网络中存储的更久,在解析系统中的级别更合理。

优选的,所述最低门限是利用当前研究已发现的内容生命周期模式来确 定的,取自于所有模式的生命周期的平均值的一部分。

优选的,可根据数据源解析系统收到的请求解析目标内容的数量和变化 趋势,预测其处于生命周期中的阶段,过程如下:

(6)利用流行度(P)、流行度加速度(PA)等参数,对内容已有生命周期模 式的特征进行数学描述与刻画;

(7)从数据源解析系统收到的目标内容解析请求的数量,计算目标内容 的P、PA,建立目标内容的时序序列;

(8)设模式数量为m,将目标内容和已有模式放在一起构成时序数据集, 即有m+1个时序数据,利用K-SC算法对其进行聚类,分类个数依 然是m;

(9)根据聚类结果判定目标内容的生命周期模式:目标内容和哪一个已 知模式在一类就把其判定为该模式;

(10)根据流行度(P)、流行度加速度(PA)预测目标内容在其生命周期 中的位置,计算其处于生命周期中的相对年龄u(0≤u≤1);

其中,所述流行度是单位时间内的用户对内容的需求数量;

所述流行度加速度是单位时间内流行度的变化速度;

所述相对年龄是内容的当前年龄在其总生命周期中的比例。

优选的,解析级别的轮换机制:

(1)、内容刚产生时,处于生命的生长期,解析需求数量会逐渐增加, 名字被放置于解析系统的最下层;

(2)、随着时间的推移,如果进入生命的消亡期,则会被逐级地推送到 解析系统的上层;

(3)、从数据源解析系统收到的请求解析目标内容的数量和变化趋势, 推测其处于生命周期中的阶段,进而确定级别的轮换;那么,当目标内容处 于生长期,名字放置的级别随相对年龄增长而下降;当目标内容处于消亡期, 名字放置的级别随相对年龄增长而上升。

优选的,存储的承诺时间的更新机制:

(1)、从数据源解析系统收到的请求解析目标内容数量和变化趋势,推 测其处于生命周期中的阶段;

(2)、据此帮助更新内容的存储承诺时间;

(3)、当目标内容处于生长期,即,需求依然保持旺盛,并且还在上升, 但该内容的承诺期限快到了,那么解析系统可以延长该内容的存储时间;当 目标内容处于消亡期,即需求很少,并还在下降,那么,当承诺时间很长, 则可以减少该内容的存储时间。

本发明涉及一种信息中心网络ICN中数据源解析方法,其采用注册-发现 机制:首先,节点存储目标内容或服务器产生内容时,都需要告诉解析服务 器(称为注册);然后,利用Bloom Filter技术,Interest查询数据源解析系统 就可以得到目标内容的全部数据源的位置(称为发现)。借鉴Q学习的思想, 本发明设计的数据源解析系统是自适应的:首先,存储机制初步确定存储内 容的承诺时间。然后,如果承诺时间大于最低门限,则注册,并确定其在解 析系统中的级别;否则,不注册。同时,利用解析系统收到的解析请求数量 推测目标内容的流行度,进而帮助更新内容的存储承诺时间及名字在解析系 统中的级别。本发明可从存在着多数据源的ICN网络中快速地发现有效数据 源,并进一步增强ICN对移动性的支持。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部 分,并不构成对本发明的不当限定,在附图中:

图1为内容生命周期规律及通过聚类后得到的有限个模式示意图;

图2为本发明实施例数据源解析机制的技术路线示意图。

具体实施方式

下面将结合附图以及具体实施例来详细说明本发明,在此本发明的示意 性实施例以及说明用来解释本发明,但并不作为对本发明的限定。

实施例

数据源放置-发现机制包括数据源的有序放置和多数据源发现两个方面。 对于前者,数据源放置策略决定着数据源的时-空分布,而数据源的时-空分布 又会影响网络流量。所以,基于优化理论,以网络流量的整体均衡为优化目 标,可实现网络节点存储资源的有效利用。所以,本发明主要研究多数据源 发现,采用数据源解析机制为其基本方案。通过该机制在内容名字和主机名 字之间建立映射关系(即,实现对象的可用性),将可以实现以下三个目标: (1)能够帮助Interest发现全部数据源。(2)内容在中间节点随时可能被替 换掉,能够大幅度地减少为此而产生的路由更新信息。(3)能够进一步增强 ICN对移动性的支持。

申请人前期在存储机制上的研究成果将是实现数据源放置-发现机制的基 础,因此需要对前期存储机制做说明:前期的存储机制:提出了一种在分布 式缓存机制中嵌入中心式缓存决策的机制(APDR:content-Aware Placement, Discovery and Replacement),它把内容的放置、发现、替换统一起来考虑,实 现内容的有序缓存,提高网络的性能。APDR的主要思想是:Interest报文除 了携带对内容的请求,还收集沿途各节点对该内容的潜在需求、空闲缓存等 信息,使得Interest的汇聚点和目的地节点,可以据此计算出一个缓存方案, 并把该方案附加在Data报文之上,通知返程途中的某些节点缓存该内容并设 置指定的缓存时间,参考文献:刘外喜,ICN中的一种协作缓存机制,软件 学报,2013,24(8):1947-1962。

节点存储了目标内容后,向控制平面的解析服务器(数据源解析服务器) 报告自己存储的内容以及承诺存储(每个节点的存储空间有限,因此,节点 经常需要替换本节点存储的内容)的时间。内容服务器(产生原始内容的服 务器,这里要与那些存储内容的中间节点区分开来。)产生内容的时候,也需 要告诉解析服务器,内容服务器存储该内容的时间是永久的,该过程被称为 注册。其中,只有流行度高的内容(在网络中的生命周期较长,我们称为大 内容)才会向解析服务器注册。内容完成注册后,利用Bloom Filter技术,Interest 查询数据源解析系统就可以得到目标内容的全部数据源的位置,该过程被称 为发现。

由于内容名字数量的海量,数据源解析系统的压力巨大,所以,本发明 拟采用基于内容的流行度的分级结构,并且级别可轮换。

在用户行为的驱动下,内容会在网络中历经生长、流行、消亡的生命周 期。如图1所示,研究已表明,内容的这一生命周期存在着规律,并且通过 聚类后可以得到有限个模式(Yang J,Leskovec J.Patterns of temporal variation  in online media.In:Proc.of the 4th ACM Int’l Conf.on Web Search and Data  Mining(WSDM 2011).2011.177-186),也可预测内容的生命周期的模式。

Q学习(Q-learning)是人工智能中一种无模型、无监督的在线强化学习算 法,其核心思想是:学习者不断地尝试,即,不断地与环境交互,根据反馈 更新策略,经过足够多次后,学习者可以获得一个最优策略。

所以,本发明借鉴Q学习的思想,数据源解析系统是自适应的,采用基 于内容流行度的分级结构,并且级别可轮换。如图2所示,基本思路是:

(1)、存储机制初步确定存储内容的承诺时间。

(2)、如果承诺时间大于最低门限,则注册,并确定其在解析系统中的级 别,否则,不注册。

(3)、利用解析系统收到的解析请求的数量和变化趋势推测目标内容的流 行度,以及其处于生命周期中的阶段,进而帮助更新内容的名字在解析系统 中的级别以及存储承诺时间。

因此,整个过程形成一个Q学习系统:不断地学习并适应于网络状态, 实现内容在节点上存储的承诺时间最优,名字在解析系统中放置的级别最优。

下面是其中几个具体问题的解决思路:

1、注册时间粒度的确定

如果内容的承诺时间过短,当Interest到达目的地时,内容可能已经被替 换掉了。所以,并不是所有的内容都有必要向解析系统注册,那样势必导致 名字映射表(内容名字与节点地址的映射关系。即,哪个节点存储了哪些内 容)会无限地膨胀并会频繁地更新,并且对实现多源传输也没有帮助。那么, 存储承诺时间到底多大才有必要向解析系统注册呢?

本发明拟采用自适应的机制进行确定:

(1)、按照最低门限进行注册;

(2)、让解析系统根据用户的需求不断地进行筛选,使得那些真正受欢 迎的内容会在网络中存储的更久,在解析系统中的级别更合理。

(3)、最低门限Threshold利用当前研究已发现的内容生命周期规律来进 行确定:Threshold=c*Σ1nTin.

其中,Ti是第i种内容生命周期模式的生命周期,设共有n个模式,c是 调整最低门限颗粒大小的调节因子,0<c<0.1。

2、预测目标内容处于生命周期中的阶段

研究已表明,内容的生命周期只存在有限个模式,因此,我们可根据数 据源解析系统收到的请求解析目标内容的数量和变化趋势,预测其处于生命 周期中的阶段,过程如下:

(1)利用流行度(P)、流行度加速度(PA)等参数,对内容已有生命周期模 式的特征进行数学描述与刻画;

(2)从数据源解析系统收到的目标内容解析请求的数量,计算目标内容 的P、PA,建立目标内容的时序序列;

(3)设模式数量为m,将目标内容和已有模式放在一起构成时序数据集, 即有m+1个时序数据,利用K-SC聚类算法(Yang J,Leskovec J. Patterns of temporal variation in online media.In:Proc.of the 4th  ACM Int’l Conf.on Web Search and Data Mining(WSDM 2011).2011. 177-186)对其进行聚类,分类个数依然是m;

(4)根据聚类结果判定目标内容的生命周期模式:目标内容和哪一个已 知模式在一类就把其判定为该模式;

(5)根据P、PA预测目标内容在其生命周期中的位置,计算其处于生命 周期中的相对年龄u(0≤u≤1);

流行度:单位时间内的用户对内容的需求数量;

流行度加速度:单位时间内流行度的变化速度;

相对年龄:内容的当前年龄在其总生命周期中的比例。

3、解析级别的轮换

为了提高解析系统的效率,解析对象在解析系统中的位置应该随解析的 需求变化而轮换。

(1)、内容刚产生时,处于生命的生长期,解析需求数量会逐渐增加, 名字被放置于解析系统的最下层。而根据用户对内容的需求存在着空间局域 性的特点,这实际上也是最靠近目标用户的地方。

(2)、随着时间的推移,如果进入生命的消亡期,则会被逐级地推送到 上层。

(3)、如上所述,从数据源解析系统收到的请求解析目标内容的数量和 变化趋势,推测其处于生命周期中的阶段,进而确定级别的轮换。那么,当 目标内容处于生长期,名字放置的级别随相对年龄增长而下降,这样更加靠 近目标用户。当目标内容处于消亡期,名字放置的级别随相对年龄增长而上 升,这样更加远离目标用户,具体的放置级别L按照如下过程确定。

a)当u≤0.5,内容处于生长期,那么,L=[1/u];

b)当u>0.5,内容处于消亡期,那么,L=[1/(1-u)+a];

其中,a是调节因子,调节目标内容在消亡期内相对于生长期内的放置 级别的差异。

4、存储的承诺时间的更新

(1)、如上所述,从数据源解析系统收到的请求解析目标内容数量和变 化趋势,推测其处于生命周期中的阶段;

(2)、据此帮助更新内容的存储承诺时间;

(3)、当目标内容处于生长期,即,需求依然保持旺盛,并且还在上升, 但该内容的承诺期限快到了,那么解析系统可以延长该内容的存储时间。当 目标内容处于消亡期,即需求很少,并还在下降,那么,当承诺时间很长, 则可以减少该内容的存储时间。新的承诺时间Tc可按如下过程确定:

a)当u≤0.5,内容处于生长期,那么,Tc=b*Tf-u*Tf

b)当u>0.5,内容处于消亡期,那么,Tc=Tf-u*Tf

其中,Tc是更新后的承诺时间,Tf是目标内容的生命周期,b是调节因子, 0.5<b<0.7,用于调节目标内容在生长期的承诺时间。

以上对本发明实施例所提供的技术方案进行了详细介绍,本文中应用了 具体个例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说 明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人 员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处, 综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号