首页> 中国专利> 一种基于广播信道传输内容标引的系统及方法

一种基于广播信道传输内容标引的系统及方法

摘要

本发明公开了一种基于广播信道传输内容标引的系统及方法,本发明中,标引生成发送前端根据源内容生成内容标引,并对其进行编码,将标引编码、源内容、内容标引及三者的对应关系表广播给代理服务器,代理服务器对收到的源内容进行IP封装,将该源内容对应的标引编码嵌入到封装后的IP包中发送给用户终端,并每间隔预设时长将所述对应关系表发送给用户终端,用户终端根据用户欲获取的内容信息生成内容标引,并根据所述对应关系表将其翻译为标引编码,将该标引编码与代理服务器发送来的IP包中嵌入的标引编码比较,保存其中匹配的IP数据包。本发明提高了信息在互联网上的传输效率和利用率,同时提高了广播电视网的服务能力。

著录项

  • 公开/公告号CN101345595A

    专利类型发明专利

  • 公开/公告日2009-01-14

    原文格式PDF

  • 申请/专利号CN200810118912.3

  • 发明设计人 袁敏;夏勇;

    申请日2008-08-26

  • 分类号H04H60/82;H04H60/41;H04L29/08;H04L12/56;H04L1/00;

  • 代理机构信息产业部电子专利中心;

  • 代理人梁军

  • 地址 100866 北京市复兴门外大街2号

  • 入库时间 2023-12-17 21:19:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-08-25

    授权

    授权

  • 2009-09-23

    实质审查的生效

    实质审查的生效

  • 2009-01-14

    公开

    公开

说明书

技术领域

本发明涉及广播电视网络技术,尤其涉及一种基于广播信道传输内容标引的系统及方法。

背景技术

随着网络视频成为数据通信的最大驱动力,美国思科公司预计,2007至2012年,全球互联网流量将增长五倍。网络视频占互联网总流量的比例将从2005年的5%增加到今年底的30%,到2012年将进一步增至50%。据估计,目前全球互联网每月流量为7EB(70亿GB),相当于20亿张DVD的容量。到2012年这一数据将达到44EB。预计两年内,网络视频将超过文件共享在总流量中的比重。如此丰富的信息给人们带来的不仅是知识和资讯的大繁荣,同时也是人们对于海量信息的迷茫。Google、Yahoo以及百度给人们带来的方便的检索工具,但是它们搜索出的结果很大一部分并不是我们想要的,人们仍然需要从它们提供的结果一一寻找。今天的WEB搜索通常会找到数不清的毫不相关的“结果”,需要大量的手工过滤工作。目前的WEB检索主要是依靠关键字对内容标题进行搜索,而不是对其内容本身。标题很难全面的对其内容进行揭示。

互联网的传输模式是一种点到点的传输,及保证数据能够准确的从源地址传输到目的地址,所以IP包结构中只有源地址和目的地址信息。没有任何所负载的内容信息,计算机无法识别其内容。无论是潦草的草稿,还是精致的作品,无论是商业信息还是学术内容,无论何种文化和语言,网络对它们都是一视同仁的。这样造成了完全相同内容会在完全相同节点之间亳无意义重覆传输,浪费网络带宽。

互联网上针对非法内容的监管一直是一个难点。不仅是因为互联网上传输信息量非常大,同时也是因为缺乏快速及准确识别的方法。分组交换技术将源内容拆解成了大量的小数据包,这些小数据包通过不同的路由到达目的地址。这样造成了每个数据包携带的传输内容是不完整的,同时也很难捕获到所有相关的小数据包。即使捕获到了一些非法内容的IP数据包,也无法分析出IP包携带的是否是非法内容,也无法确定是谁在传输,它利用什么协议在进行传播。这就给控制网络非法信息传播,造成了很大的困难。尤其是近年来互联网P2P业务蓬勃发展,其流量已占到网络总流量的60%以上,在如此大量的P2P流量中充斥着反动、色情、暴力等有害信息,其传播范围之广、传播速度之快是传统互联网无法比拟的,对其强化监管已经迫在眉睫。

在互联网信息传输过程中,缺乏对信息提供者和信息类别认证机制,是造成互联网不安全的一个重要原因。用户无法识别其接受信息的来源及数据类型,更加无法判读接收数据是否安全,不少不法分子利用这一点,对非法程序进行伪装植入用户系统,对用户个人信息进行窃取,谋取非法所得。目前,对非法入侵和病毒的识别,主要在获取已知的入侵行为特征及病毒特征上,对网络信息进行对比判断。而对于越来越多的新型攻击方式和病毒,计算机用户很难在第一时间进行防御。

标引是对内容进行特征提取和标识引导的过程,它的目的是揭示内容特征,便于集中同类的内容,区分不同的内容,为相关内容建立联系。通过标引可提高资源的管理和利用率。标引把对内容的检索转变为对结构化数据的检索,提高计算机检索的质量。

传统标引是基于关键字的,即通过词频统计提取关键字,然后根据关键字对文档进行索引。这种方式已广泛用于各种商业搜索引擎。基于关键字的标引方式是建立在一些假设的基础上,如关键字之间彼此独立、关键字不具有二义性等,这些假设使得处理过程大大简化,却也使标引方式停留在关键字的字面异同的逻辑层面上。不同的语境中,相同的关键字可能表示不同的含义,而不同的关键字也可能表达同一种意思。关键字之间往往也并非毫无关系。基于关键字的标引忽略了概念层面或语义层面的含义,是导致检索效果不够理想的关键因素。

发明内容

本发明提供一种基于广播信道传输内容标引的系统及方法,通过将每天互联网与广播电视上的热点内容打上标引,利用广播电视网或者卫星主动推送到离用户的代理服务器上,使用户可以随时就近获取丰富的节目内容。

本发明所述技术方案如下:

一种基于广播信道传输内容标引的系统,包括标引生成发送前端、代理服务器和用户终端,其中,

标引生成发送前端,用于根据源内容生成内容标引,并对内容标引进行编码生成标引编码,将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播信道广播给多个代理服务器;

代理服务器,用于对接收到的源内容进行IP封装,将该源内容对应的标引编码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将接收到的源内容、内容标引及标引编码的对应关系数据表发送给用户终端;

用户终端,用于根据用户欲获取的内容信息生成内容标引,并将该内容标引翻译成相应的标引编码,将该标引编码与接收到的IP数据包中嵌入的标引编码进行比较,保存匹配的IP数据包。

进一步地,所述系统进一步包括:

监管服务器,用于实时获取代理服务器发出的IP数据包,判断IP数据包中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包,并将该非法数据包的信息予以上报。

一种基于广播信道传输内容标引的方法,包括步骤:

A、标引生成发送前端根据源内容生成内容标引,并对其进行编码,将生成的标引编码、源内容、内容标引及三者之间的对应关系数据表通过广播信道广播给多个代理服务器;

B、代理服务器对接收到的源内容进行IP封装,将该源内容对应的标引编码嵌入到封装后的IP数据包中发送给用户终端,同时每间隔预设时长将接收到的标引编码、源内容及内容标引的对应关系数据表发送给用户终端;

C、用户终端根据用户输入的欲获取的内容信息生成内容标引,并将该内容标引翻译为标引编码,将该标引编码与代理服务器发送来的IP数据包中嵌入的标引编码进行比较,接收其中匹配的IP数据包。

进一步地,所述内容标引中包含所述源内容的来源、类型、播出策略、分类码、特征值、传输者信息码、提供方式及传输格式信息。

进一步地,所述步骤B中还包括代理服务器对接收到的标引编码、源内容、标引内容及三者之间的对应关系数据表予以保存的步骤。

进一步地,所述步骤C中,用户终端在接收到的标引编码、源内容及内容标引的对应关系数据表中对用户欲获取的内容信息对应的内容标引进行匹配,将匹配项中的标引编码作为翻译结果。

进一步地,所述步骤C后还包括步骤:

用户终端从所述匹配的IP数据包中解析出标引编码,根据该标引编码对应的内容标引中包含的播出策略信息判断IP数据包中的源内容是否为紧急广播,若是,则从该匹配的IP数据包中解析出源内容并予以显示,否则,执行下一步骤;

用户终端判断该内容标引与本地已保存的内容标引是否重复,若是,则放弃保存该匹配的IP数据包,否则,从该匹配的IP数据包中解析出源内容并予以显示。

进一步地,所述步骤B后还包括步骤:

监管服务器实时获取代理服务器发出的IP数据包,判断IP数据包中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包,并将该非法数据包的信息予以上报。

本发明有益效果如下:

本发明将互联网的存储转发思想带入到广播电视传输中,通过广播电视网的不间断的实时推送能力,将带标引的内容主动推送到用户的代理服务器上。用户通过内容标引指定自己有兴趣的内容,代理服务器将这些内容主动下载到用户终端。利用标引技术可以大大提高目前音视频信息在互联网上的传输效率和信息的利用率,同时节省带宽。并在精确搜索、舆情分析、实时监管传输信息及主动服务实现技术突破。

本发明中标引是嵌入到IP包中,与IP协议完全兼容,使得带有标引信息的数据包可以在互联网上畅通无阻。通过本发明,利用广播电视网来传输热点内容到用户身边,有效的解决了用户在互联网上收看视频节目内容不畅,信息孤岛、主动服务以及监管困难等方面的问题,实现互联网与广播电视网的互补双赢。

附图说明

图1为本发明中提出的内容标引的层次结构示意图;

图2为本发明所述基于广播信道传输内容标引的系统的原理图;

图3为本发明中将标引编码嵌入到封装后的IP数据包的位置示意图;

图4为本发明所述基于广播信道传输内容标引的系统在具体实现中的系统部署图;

图5为本发明中内容标引传输模型示意图;

图6为本发明中标引生成发送前端生成及发送内容标引的流程图;

图7为本发明中代理服务器接收、解析及播发内容标引的流程图;

图8为本发明中用户终端从接收到的数据包中获取用户感兴趣的内容的流程图;

图9为本发明中监管服务器对代理服务器发出的IP数据包进行合法性判断的流程图。

具体实施方式

本发明所述技术方案的主要技术构思是将互联网的存储转发思想带入到广播电视传输中,通过广播电视网的不间断的实时推送能力,将带标引的内容主动推送到用户的代理服务器上。用户通过内容标引指定自己有兴趣的内容,代理服务器将这些内容主动下载到用户终端。利用标引技术可以大大提高目前音视频信息在互联网上的传输效率和信息的利用率,同时节省带宽。并在精确搜索、舆情分析、实时监管传输信息及主动服务实现技术突破。利用现有的覆盖全国的广播电视网将热点信息直接传输到离用户最近的代理服务器上,用户可以在仅用几跳的范围内来获取数据,那么将大大提高用户的服务体验。这种广播方式的内容分发网络比利用互联网实现的内容分发网络的结构要简单,而且建设成本很低。同时互联网实施边缘存储后,流量的一半甚至大半将由广播结构分流,共享视频引入的带宽冲突随之化解,不仅在线视频流畅,端对端结构的个案交流功能也会如释重负,倍感轻松。

下面将结合各个附图对本发明的具体实现过程做进一步详细的说明。

请参阅图1,该图为本发明中提出的内容标引的层次结构示意图,本发明中内容标引的层次结构分为属性层及传输层,其中各个字段的含义如下:

来源:用于标明该内容的提供者;

子目:用于标明传输的内容的类型(如网页、音频广播或是视频广播),便于与其他内容相近的文件自动聚类。

播出策略,用来区分内容传输及播出的优先级。

分类码:根据已经颁发的国家和行业相关标准为基础,对信息进行分类标识。

内容特征码:用于对传输的节目内容按照一定的算法提取出内容的特征值。

传输者信息码:用于标识出内容传输者的身份信息。

服务方式:用于说明内容提供方式。

传输格式信息:用于说明节目内容编码格式及封装信息。

请参阅图2,该图为本发明所述基于广播信道传输内容标引的系统的原理图,由图中可见,本发明所述基于广播信道传输内容标引的系统主要包括标引生成发送前端、代理服务器和用户终端,其中,

标引生成发送前端,用于根据源内容生成内容标引,并采用预先确定的编码算法(如哈希算法、B编码等)对内容标引进行编码生成标引编码,同时生成源内容、内容标引及标引编码三者之间的对应关系数据表,将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播电视网中的广播信道广播给代理服务器;

代理服务器,用于接收标引生成发送前端通过广播电视网主动推送来的源内容、内容标引、标引编码及三者之间的对应关系数据表,对接收到的源内容进行IP封装,同时如图3所示,将该源内容对应的标引编码嵌入到封装后的IP数据包的option字段中广播给用户终端,以及每间隔预设时长(如5秒)将接收到的源内容、内容标引及标引编码的对应关系数据表发送给用户终端;

用户终端,用于接收用户通过界面输入的欲获取的内容信息,根据标引层次结构形成生成内容标引,在接收到的源内容与标引编码之间的对应关系数据表中对用户欲获取的内容信息对应的内容标引进行模糊匹配,记录匹配项中的标引编码,将匹配项中的标引编码作为过滤规则,对每个接收到的IP数据包中嵌入的标引编码进行比较,保存匹配的IP数据包。

本发明所述系统中还可以进一步包括:

监管服务器,用于实时获取代理服务器发出的IP数据包,判断IP数据包中是否携带有标引编码,将没有携带标引编码的IP数据包确定为非法数据包,并将该非法数据包的信息予以上报,实现了对IP数据包的合法性判断。

请参阅图4,该图为本发明所述基于广播信道传输内容标引的系统在具体实现中的系统部署图,由图中可见,标引生成发送前端将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播卫星和有线电视广播网广播给多个代理服务器;代理服务器采用单向的广播方式对用户终端进行内容传输,用户终端一直在接收数据,但是只是保留了标引匹配的数据内容。

相应于本发明上述系统,本发明进而提出了一种基于广播信道传输内容标引的方法,请参阅图5,该图为本发明中内容标引传输模型示意图,由图中可见本发明中内容标引传输的主要流程包括以下步骤:

1)标引生成及嵌入:根据源内容生成内容标引,并对内容标引进行编码生成标引编码,同时生成源内容、内容标引及标引编码三者之间的对应关系数据表,将源内容、内容标引、标引编码及三者之间的对应关系数据表通过广播电视网进行推送。每当编辑一个内容标引时,系统自动生成发送引擎需要的IP数据包,内容按照指定格式组织,一个内容标引只占用整数个IP数据包,两个内容标引不能同在一个IP数据包中。

2)标引接收、解析及播发:接收广播电视网主动推送来的源内容、内容标引、标引编码及三者之间的对应关系数据表,将其保存到指定位置,对接收到的源内容进行IP封装,同时将该源内容对应的标引编码嵌入到封装后的IP数据包的option字段中广播给用户终端,以及每间隔预设时长(如5秒)将接收到的源内容、内容标引及标引编码的对应关系数据表发送给用户终端;

3)内容获取:用户终端接收用户通过界面输入的欲获取的内容信息,根据标引层次结构形成生成内容标引,在接收到的源内容与标引编码之间的对应关系数据表中对用户欲获取的内容信息对应的内容标引进行模糊匹配,记录匹配项中的标引编码,将匹配项中的标引编码作为过滤规则,对每个接收到的IP数据包中嵌入的标引编码进行比较,保存匹配的IP数据包。

请参阅图6、该图为本发明中标引生成发送前端生成及发送内容标引的流程图,其主要包括步骤:

步骤10、标引生成发送前端根据源内容生成内容标引,并对其进行编码,同时利用预设的算法(如哈希算法、B编码等)生成标引编码、源内容及内容标引三者之间的对应关系数据表;

所述内容标引的层次结构如图1所示,其中包含所述源内容的来源、类型、播出策略、分类码、特征值、传输者信息码、提供方式及传输格式信息。

步骤11、标引生成发送前端将生成的标引编码、源内容、内容标引及三者之间的对应关系数据表通过广播电视网中的广播信道广播给多个代理服务器。

请参阅图7、该图为本发明中代理服务器接收、解析及播发内容标引的流程图,其主要包括步骤:

步骤12、代理服务器接收标引生成发送前端通过广播电视网主动推送来的数据。

步骤13、代理服务器从接收到的数据中解析出标引编码、标引内容、源内容以及三者之间的对应关系数据表,将其保存到指定的位置。

步骤14、代理服务器对接收到的源内容进行IP封装。

步骤15、代理服务器将标引编码嵌入到封装后形成的每个IP数据包的option段中。

步骤16、代理服务器持续广播推送携带有标引编码的IP数据包,同时每间隔预设时长推送一次标引编码、源内容及内容标引三者之间的对应关系数据表。

请参阅图8、该图为本发明中用户终端从接收到的数据包中获取用户感兴趣的内容的流程图,其主要包括步骤:

步骤17、用户终端根据用户输入的欲获取的内容信息,按照标引层次结构生成内容标引。

步骤18、用户终端接收代理服务器推送的标引编码、源内容及内容标引的对应关系数据表。

步骤19、用户终端在接收到的标引编码、源内容及内容标引的对应关系数据表中对用户欲获取的内容信息对应的内容标引进行模糊匹配,将匹配项中的标引编码作为过滤规则。

步骤20、用户终端将作为过滤规则的标引编码与代理服务器发送来的IP数据包中嵌入的标引编码进行比较,保存其中匹配的IP数据包。

步骤21、用户终端从所述匹配的IP数据包中解析出标引编码,根据该标引编码对应的内容标引中包含的播出策略信息判断IP数据包中的源内容是否为紧急广播,若是,执行步骤22,否则,执行步骤23。

步骤22、用户终端从该匹配的IP数据包中解析出源内容并予以强制显示。

步骤23、用户终端判断该内容标引与本地已保存的内容标引是否重复,若是,执行步骤24,否则,执行步骤25。

步骤24、用户终端放弃保存该匹配的IP数据包。

步骤25、用户终端从该匹配的IP数据包中解析出源内容并添加到显示队列中等待排队显示。

请参阅图9,该图为本发明中监管服务器对代理服务器发出的IP数据包进行合法性判断的流程图,其主要实现过程为:

步骤30、获取代理服务器发出的IP数据包;

步骤31、根据IP协议分析IP数据包包头的结构;

步骤32、判断IP数据包的包头中是否携带有标引编码,若是,则确定该IP数据包为合法数据包,否则,将没有携带标引编码的IP数据包确定为非法数据包,并将该非法数据包的信息予以上报。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号