首页> 中国专利> 规避内容阻挡逻辑的操作的方法和系统

规避内容阻挡逻辑的操作的方法和系统

摘要

一种规避置标语言文档传递系统中内容阻挡逻辑的操作的方法。在本发明的方法中,能够确定内容阻挡逻辑的操作。响应该确定,置于置标中的内容的引用能够被定位,并且可用别名代替内容的引用。最后,置标可被提供给发出请求的浏览器。这样,用别名代替引用可规避内容阻挡逻辑的操作。

著录项

  • 公开/公告号CN1585333A

    专利类型发明专利

  • 公开/公告日2005-02-23

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN200410057408.9

  • 申请日2004-08-12

  • 分类号H04L12/00;H04L12/24;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人吴丽丽

  • 地址 美国纽约

  • 入库时间 2023-12-17 16:00:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-11-03

    未缴年费专利权终止 IPC(主分类):H04L12/00 授权公告日:20070214 申请日:20040812

    专利权的终止

  • 2007-02-14

    授权

    授权

  • 2005-04-27

    实质审查的生效

    实质审查的生效

  • 2005-02-23

    公开

    公开

说明书

技术领域

本发明涉及因特网安全领域,更具体地说,涉及内容过滤。

背景技术

全球因特网代表自电视的出现以来,广告业的最重要发展。在全球因特网上广泛采用万维网之前,媒体市场局限于印刷、广播和电视广告。多数情况下,除了观看广告之外,目标个体没有任何选择。例如,就电视广播来说,广告可作为附加内容包含在广播流中,所述附加内容与广播节目不可区分。另外要注意的是在电视广播的环境中,先进的数字记录设备已被证明能够部分或者完全地从录制的电视节目中除去广告,即使广告难以区分。

和电视广播媒体不同,在因特网媒体中,通常以定义电子文档的置标(markup)的嵌入部分的形式,传送广告。置标语言在本领域中众所周知,例如,不仅包括历史悠久的超文本置标语言(HTML),而且包括可扩展置标语言(XML),无线置标语言(WML),和标准通用置标语言(SGML)的许多变型。如同本领域的技术人员认识到的那样,除了可显示内容的其它形式之外,这种电子文档包括Web页。置标语言文档不仅能够定义可通过诸如Web浏览器(下面称为“浏览器”)之类内容浏览器查看的内容,而且能够定义可结合内容表现的补充内容。

补充置标的内容不仅可包括广告(通常呈嵌入图像引用的形式),而且可包括嵌入媒体引用,其它置标语言文档的引用,置标语言片断,其它类型的文档,程序,脚本等。在这方面,补充内容可以是根据其中嵌入补充内容的引用的置标,可由浏览器加载或者可借助浏览器加载的任意内容。例子可包括可被自动加载的图像引用,或者响应用户事件,例如当用户在呈现于浏览器中的置标的规定部分上,拖过鼠标指示器时,能够被激活的脚本或页面。

在操作上,当浏览器取回置标时,浏览器能够解析置标,以便表现文档。特别地,对于在置标内引用的内容的各个引用,浏览器能够取回引用的内容,并且随后能够如同所述引用规定的那样,在置标内或者结合所述置标表现该内容。重要的是,众所周知出于安全性和效率方面的原因,在内容和置标的来源与浏览器之间放入反向代理服务器(代理人)。具体地说,反向代理服务器能够服务于在置标内引用的补充内容。从而,对本领域的技术人员来说,代理人显然被布置成了解在表现置标的过程中,单个浏览器请求的补充内容的真实位置。

和电视广播的情况一样,目标受众中的许多人不喜欢在浏览的时候被淹没于广告之中。此外,许多人希望限制补充内容的表现。通过内容阻挡技术的开发,市场已对这种已知的偏爱作出了响应。过滤代表这种内容阻挡技术的一个实施例。具体地说,过滤涉及统一资源标识符(URI)的各个部分与不需要内容的已知来源的联合。从而,每次浏览器(或者代表浏览器作用的正向代理服务器,视情况而定)识别引用内容的URI内的已知源串时,关于该内容的请求可被忽略,当表现置标时,可省略该内容。从而,被阻挡的内容决不会被取回、高速缓存、显示或者被用户看到。事实上,被阻挡的内容只是不能到达其目标受众。

最初,只有富有技术经验的人们才采用内容阻挡技术,占在线群体的百分比相当小。许多专家认识到如果内容阻挡的功能和其它面向Web的软件打包在一起,那么内容阻挡会被更广泛地采用。目前,已开始在其它面向Web的产品内集成内容阻挡技术,例如把某一类别的内容阻挡技术包含在来自数个主要的安全和病毒检测制造商的软件中。

内容阻挡的支持者声称通过不下载慢速加载的广告横幅和按钮,能够提高浏览速度。在这方面,慢速加载的补充内容会禁止浏览整个页面,直到补充内容装入或者超时为止。另一方面,内容阻挡的反对者注意到内容阻挡相当于偷窃,因为通过查看诸如广告之类的补充内容,ad-free网上冲浪人员使用主要内容提供者的有价值资源,而不间接“支付”主要内容的费用。一些主要内容发布者甚至拒绝内容阻挡访问者。

如果被广泛采用,那么对于万维网的用户来说,内容阻挡会导致某些重要的无意识后果。例如,阻挡可被容易地识别为广告的任何内容实际上会鼓励更主动的收入产生模型。如果合法广告被消除,那么网站会感到压力,从而通过使用暗中支付的“社论式广告”(在房地产和汽车市场中情况已是如此)牺牲社论完整性(editorial integrity),在“社论式广告”中,付费广告伪装成无偏见的社论性意见。最后,可以想到的是如果主要内容提供者不再从补充内容获得收入,那么他们会创立新的商业模型,所述商业模型涉及通过置标向用户提供主要内容的预约或按次计费。

目前,存在无意地能够有效规避内容阻挡的技术。具体地说,统一资源定位符(URL)重写已被用于掩蔽到内容位置的真实路径。然而,不加选择地使用URL重写会使高速缓存(增强Web页的响应的主要机制)失效。在URL重写不加选择地改变到内容的路径的情况下,会失去高速缓存的优点,并且会不必要地消耗网络带宽。因此,URL重写本身不能用作解决补充内容被阻挡问题的方案。

发明内容

本发明是规避置标语言(markup language)文档系统中内容阻挡逻辑(content blocking logic)的操作的系统、方法和机器可读存储器。补充置标的内容不仅可包括广告(一般呈嵌入的图像引用的形式),而且还包括嵌入的媒体引用,对其它置标语言文档的引用,置标语言片断,其它类型的文档,程序,脚本等。在本发明的方法中,能够确定内容阻挡逻辑的操作。响应该确定,置于置标中的内容的引用能够被定位,并用别名代替内容的引用。最后,置标可被提供给发出请求的浏览器。这样,用别名代替引用规避了内容阻挡逻辑的操作。

值得注意的是,对于来自相同或其它浏览器的关于置标的后续请求,可重复该过程。在这方面,本发明的方法还可包括在提供步骤之后,用新的别名代替别名,并把具有新别名的置标提供给发出请求的浏览器。在本发明的一个优选方面,根据可逆的公式,新别名可不同于最近使用的别名,或者可按照循环方式从一组别名中选出。此外,在本发明的一个特殊实施例中,可在置标中插入一个刷新标记,命令在缩短的一段时间内刷新该置标。从而,在刷新之后,可利用新的别名实现定位、替换和提供步骤。

确定步骤包括跟踪置于置标中的许多内容引用。确定步骤还可包括还跟踪关于当表现置标时产生的内容的许多请求。最后,确定步骤可包括当引用和请求之间的差异超过阈值时,确定已发生内容阻挡的步骤。在备选实施例中,确定步骤可包括统计上跟踪提供的内容的实例,并且当提供的补充内容中的一个特定补充内容未如同统计跟踪所示那样经常地被提供时,确定发生了内容阻挡。

替换步骤可包括根据引用用公式表示别名,并用别名替换引用。因此,在本发明的另一具体实施例中,公式表示步骤可包括把别名编码成统一资源标识符(URI)串。在编码串内可散布文件系统定界符,以产生到内容的模拟路径。此外,本地文件系统的网络地址可与模拟路径相组合。从而,模拟路径和相对于引用的相关性可被记录在别名表中,以便当把模拟路径解除引用(dereferencing)成URI时之用。

在更详细的举例说明中,可根据引用用公式表示别名,并可用所述别名替换引用。为此,可在别名表中产生一个条目,使别名与实际内容的位置相关联。这样,可根据别名,响应内容请求,取回实际内容。最好,只利用在URI中许可的那些字符,例如包括base-64编码,对别名编码。另外,就包括代表二进制日期-时间戳记或计数器的非许可字符来说,这样的非许可字符可被转换成许可的字符。

本领域的技术人员会认识到可按照几种不同的方式构成别名,这几种不同方式都不应被理解成对本发明范围的限制。例如,可使用几种可选的元素,例如初始引用,内容的实际文件系统位置,文件系统定界符和别名表可将其看作定界符的其它许可字符。可按照各种方式组合这些可选要素,例如通过相互连接,与日期/时间戳记,递增的计数器等连接,随后随机地插入0或多个文件系统定界符,使别名看起来是正常的URI。理想地,别名(涉及补充内容)的域名部分应与涉及主要内容的域名相同。借助别名转换表,或者根据把别名转换成初始URI的过程,能够响应引用别名的请求,取回补充内容。

附图说明

图中表示了目前优选的实施例,但是本发明显然并不局限于所示的精确布置和手段,其中:

图1是内容传递系统的方框图,所述内容传递系统被配置成改变对与已检测到内容阻挡的置标相关的补充内容的引用;

图2是图解说明改变对与图1的置标相关的补充内容的引用的过程的流程图;

图3是图解说明列出供图1的补充内容的引用所用的别名的过程的流程图。

具体实施方式

本发明是一种改变置标语言文档中,对补充内容的引用的方法、系统和设备。对补充内容的引用可被嵌入置标语言内容中,从而当在浏览器收到置标语言文档时,浏览器能够请求传递引用的补充内容。在由于浏览器未请求一个或多个引用的补充内容的结果,检测到内容阻挡的情况下,可改变对被阻挡的补充内容的引用,以便规避检测到的内容阻挡进程。

图1是图解说明在检测到内容阻挡的情况下,置标语言文档传递系统的方框图,所述系统被配置成改变置标语言文档中对补充内容的引用。传递系统可包括与全球因特网110耦接的置标语言文档服务器120,通过全球因特网110,置标语言文档服务器120能够把请求的置标190A提供给一个或多个浏览器130(为了便于图解说明,只表示了一个浏览器)。值得注意的是,本领域众所周知,一个或多个浏览器130可不直接与全球因特网110耦接,而是通过布置在中间的正向代理服务器(未示出)与全球因特网110耦接。另外,浏览器通过全球因特网110请求并取回置标190A的准确方式并非本发明原理的要点。

如同本领域中常见的那样,内容阻挡逻辑180可直接地,或者通过代理服务器间接地与浏览器130通信耦接。内容阻挡逻辑130能够保持认为不合需要的补充内容的来源的列表。通常,该列表可包括引用补充内容的URI的多个部分。总之,内容阻挡逻辑130能够过滤具有其URI或者至少其一部分已被标记为不合需要的引用的取回的置标190A补充内容。所得到的过滤置标190B可在浏览器中表现,而没有内容阻挡逻辑180从取回的置标190A滤除的补充内容150。作为过滤置标语言文档190A的一种备选方法,内容阻挡逻辑180可驻留在浏览器130中,简单地避免取回,或者取回但是不呈现置标中,与不合需要的内容源列表中的条目相符的引用所规定的补充内容。

置标服务器120可与一个或多个补充内容服务器140耦接(为了简化图解说明,只表示了一个补充内容服务器140)。除了置标服务器120之外,补充内容服务器140还能够直接与全球因特网110耦接(或者可选的是与反向代理160耦接)。每个补充内容服务器140可被配置成应请求并且与向浏览器130传送置标190A相结合,传递补充内容150。补充内容150可包括(但是不限于)图像,多媒体文档和数据,辅助置标或置标语言片断,Java小程序,应用程序,动画,流式媒体等。重要的是,根据本发明的安排,虽然置标服务器120能够保持知晓到补充内容150的路径的状态,不过不必在通过全球因特网110向浏览器130提供的置标190A中提供路径的知识。

重要的是,反向代理160(本领域中称为“代理人”)能够与置标服务器120耦接,以及与全球因特网110耦接。本领域中众所周知,可通过反向代理160发送关于置标190A的请求,反向代理160又能够通过全球因特网把置标190A提供或转发(视情况而定)给浏览器130。但是,根据本发明,在把置标190A转发给浏览器130之前,如同这里所述,反向代理160能够把处理让与可变别名使用逻辑部分200。

在内容阻挡逻辑180(不论它是和浏览器130驻留在相同的计算机中,还是在浏览器130之外)通过对照列表,比较补充内容的引用进行工作的情况下,置于反向代理160中的可变别名使用逻辑部分200可被配置成通过产生,并且随后改变补充内容150的别名引用,规避内容阻挡逻辑180的操作。更具体地说,例如,可变别名使用逻辑部分能够用内容阻挡逻辑180未知的别名替换涉及置标190A中的补充内容150的URI。所述别名不仅能够包括到补充内容150的模拟文件系统路径,而且还包括与主要内容相关的置标服务器120的域名,并且并不包括与补充内容相关的补充内容服务器140的域名。这样,在内容阻挡逻辑180具有阻挡由具有特定文件系统路径或其一部分,或者特定域名或其一部分,或者域名和文件系统路径的多个部分的组合的URI涉及的所有补充内容的配置的情况下,内容阻挡逻辑180不可能具有阻挡来自与置标服务器120相关的域的所有内容的配置,因为禁止所请求置标190A的完全显示决不是内容阻挡逻辑180的目的。

为了保持对补充内容150的位置的了解,以及对与置标190A中的补充内容150相关的别名的了解,可变别名使用逻辑部分200可与别名表170耦接。别名表170可包括使别名和补充内容150相互联系的条目。每次在所请求的置标190A内,向浏览器130提供别名时,可变别名使用逻辑部分200能够确保别名表170包含别名的相关条目。

值得注意的是,在本发明的一个备选实施例中,可变别名使用逻辑部分200可被置于反向代理160中,或者与反向代理160相联系。总之,当内容阻挡逻辑180的操作变得可疑时,可变别名使用逻辑部分200能够无条件地改变补充内容150的别名。具体地说,可变别名使用逻辑部分200能够任意地列出别名,以便定期地,随机地或者每次当浏览器130请求置标190A时产生新的别名。由于在别名表170变得不得不跟踪别名和补充内容之间相互关系的多样性的情况下,性能会变弱,因此在改变置标190A中的别名的过程中,还可应用循环技术。另一方面,可应用以补充内容150的URI的全部或一部分为基础的别名的公式编码,以便可重现地并且可逆地列出可被格式化成别名的编码串。在这种实施例中,可逆的公式表示可被倒转,以便当收到借助别名,关于补充内容的请求时,可把别名转换成对补充内容的真实引用。

图2是图解说明改变与图1的置标相关的补充内容的引用的过程的流程图。开始于方框210,请求的置标可在可变别名使用逻辑部分中被接收。在判定方框220中,能够确定内容阻挡逻辑的操作是否可疑。怀疑判定能够起因于数种技术中的任意之一,例如比较置于置标中的补充内容的引用与请求的补充内容。在引用被置于置标中,但是还没有请求相关补充内容的情况下,能够认为已发生内容阻挡。另一方面,能够跟踪正在进行的统计,所述统计说明传递补充内容方面的趋势。在传递的补充内容的数目没有达到统计标准的情况下,能够认为内容阻挡逻辑的操作已禁止补充内容的传递。

值得注意的是,做出判定的实际系统能够考虑到有时可从浏览器的本地高速缓冲存储器取回补充内容,或者有时可从置于浏览器和可变别名使用逻辑部分之间某处的代理服务器的高速缓冲存储器取回补充内容,而不必浏览器明确地向补充内容服务器请求补充内容。做出判定的实际系统还可考虑到生存时间值以及与置标语言内容和补充内容的传递和高速缓存相关的其它高速缓冲存储器控制参数。但是,本领域的技术人员会注意到当确定本发明的范围时,做出判定的确切方式-例如系统管理人员的现有知识,提供的置标内的引用和关于引用的后续请求的直接相互关联,手段,统计等-并不重要。

如果在判定框220中,内容阻挡并不可疑,那么置标可被转发给浏览器260,所述过程能够重复通过方框210。否则,在方框230中,置标可被解析,并且能够确定其中的一个或多个补充内容的引用的位置。对于选择的别名使用的每个引用,可在方框240中列出别名。所述别名可包括到补充内容的模拟路径,以及足以通过可变别名使用逻辑部分200,发送关于补充内容的后续请求的域名。随后,可用该别名替换置标中的引用。在方框250中,使所述引用与所述别名相联系的关联记录可被写入别名表170中。最后,在方框260中,置标可被转发给浏览器。

重要的是,在本发明的另一方面,可在置标中布置本领域中众所周知的刷新标记,以便强制再现浏览器向置标服务器请求置标的刷新版本。众所周知,刷新标记不仅能够详细规定在刷新置标之前,必须过去的时间的数量,而且能够详细规定供刷新过程之用的置标的URI。总之,根据本发明,在刷新时,置标中别名的变化能够强制实现先前被阻挡的补充内容的表现。从而,通过利用列出的别名改变刷新置标内的引用,能够实现许多补充内容。另一方面,刷新标记能够引用不同于初始置标的置标语言文档,并且不同的置标语言文档能够包括新的别名。

在本发明的另一方面,通过编码过程,能够根据公式产生别名。图3是图解说明根据本发明的一个具体方面,产生补充内容的别名引用(所述引用包含在置标语言文档中)的过程的流程图。始于方框310,通过解析过程,能够在置标中确定补充内容的引用的内容。一旦被定位,那么在方框320中,可从所述引用中抽取URI。在方框330中,URI可被用作产生编码串,例如Base 64编码串的种子。在方框340中,根据编码串,能够用公式表示到补充内容的模拟路径。具体地说,可关于编码串间歇地布置文件位置定界符,例如“\”字符,以便产生模拟路径。在方框350中,模拟路径又能够与诸如“http://”之类表示协议-主机的前缀,诸如www.mydomain.com之类域,和诸如“.gif”或“.txt”或“.exe”之类表示文件类型的后缀组合。在方框360中,所得到的引用,例如“http://www.mydomain.com/ab/cdef/ghijk/lmnop.gif”可被置于置标中,代替现有的引用。

本发明可用硬件、软件或者硬件和软件的组合来实现。可在一个计算机系统中,以集中方式实现本发明的方法和系统,或者在不同的部件散布在数个互连的计算机系统的情况下,可按照分布方式实现本发明的方法和系统。任意类型的计算机系统,或者适合于执行这里描述的方法的其它设备适于实现这里描述的功能。

硬件和软件的典型组合可以是具有计算机程序的通用计算机系统,所述计算机程序当被加载和执行时,控制计算机系统,以致计算机系统实现这里描述的方法。本发明还可被嵌入计算机程序产品中,所述计算机程序产品包括能够实现这里描述的方法的所有特征,并且当被装入计算机系统中时,能够执行这些方法。

本语境中的计算机程序或应用程序意味着一组指令的用任意语言、代码或符号的任意表示,所述一组指令意图使具有信息处理能力的系统直接地或者在下述之一或两者之后执行特定功能:a)转换成另一语言、代码或符号;b)按照不同的材料形式再现。重要地,可用其它具体形式具体体现本发明,而不会脱离本发明的精神或基本属性,因此,本发明的范围由下面的权利要求限定,而不是由前面的说明书限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号