公开/公告号CN101977235A
专利类型发明专利
公开/公告日2011-02-16
原文格式PDF
申请/专利权人 北京北信源软件股份有限公司;
申请/专利号CN201010529871.4
申请日2010-11-03
分类号H04L29/08(20060101);H04L29/06(20060101);
代理机构
代理人
地址 100081 北京市海淀区中关村南大街34号中关村科技发展大厦C座16层
入库时间 2023-12-18 01:48:00
法律状态公告日
法律状态信息
法律状态
2013-03-27
授权
授权
2011-09-14
实质审查的生效 IPC(主分类):H04L29/08 申请日:20101103
实质审查的生效
2011-02-16
公开
公开
技术领域
本发明涉及计算机技术领域,尤其涉及一种针对HTTPS加密网站访问的网址过滤方法。
背景技术
应用网络化是未来互联网发展的一个主要趋势,同时一些新生的互联网黑色产业,如钓鱼、挂马,涉黄、涉赌、涉毒的网站比比皆是,通过对用户访问的网址进行过滤鉴别,对访问行为进行过滤和审计,通过专业的URL库匹配URL所属的分类,对在访问规则允许之外的URL进行过滤与阻断,对网络应用提供安全保护机制。
传统的数据传输是采取明文的方式,一般通过将数据包逐层剥离的方式提取URL信息,并加以判断过滤。HTTPS是一种基于身份认证的安全访问协议,通过HTTPS安全加密传输协议传输的数据在传输层对网络连接进行加密,从而使得传输的内容不能轻易的被获取和破解。网络应用的安全问题得到了保障,但这同时也给URL的提取带来了很大的难度。
本发明方案主要解决目前对加密网站不能过滤的问题,通过本发明方案,可以有效的对HTTPS加密网站的网址进行过滤。
发明内容
本发明的目的在于提出一种针对HTTPS加密网站访问的网址过滤方法,克服了HTTPS加密传输的网址信息提取困难的缺点,不对网络造成干扰,实现对用户访问HTTPS网站过滤的效果。
为达此目的,本发明采用以下技术方案:
A、用户发起连接,并产生数据包;
B、抓取用户访问互联网数据包;
C、判断识别所抓取数据包属于某个网络连接。如果能,转至步骤E,如果不能,转至步骤D;
D、退出。
E、通过数据包所在端口,判断所抓取的数据包是否属于HTTPS协议下的数据包。如果是,转至步骤F,如果不是,转至步骤D。
F、判断数据包是否连接发起时的交互认证数据包,如果是,转至步骤G,如果不是,转至步骤D。
G、获取认证数据包中的网站证书信息。
H、解析网站证书内容。
I、获取证书中内嵌的URL域信息,如果顺利获取,转至步骤J,如果没有,转至步骤D。
J、通过比对网站证书中的URL和浏览器输入的URL,验证URL信息是否正确,如果正确,转至步骤K,如果不一致,转至步骤D。
K、提取URL条目。
L、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。
M、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
还包括以下步骤:
通过寻找对应连接、判断数据包是否属于HTTPS流、数据包是否属于认证报文等条件,过滤抓取到的数据包,提取网站证书。
通过扫描数据包的内容,如连续出现特定URL域标示字符串,提取该字节序列后的URL,然后将网站证书中的URL信息和浏览器输入的URL进行比对,从而判断URL信息的正确性。
采用了本发明的技术方案,解决目前对加密网站提取URL困难、不能过滤的问题,通过本发明的技术方案,在不对网络造成影响的前提下,可以有效的对HTTPS加密网站的网址进行过滤。
附图说明
下图是本发明具体实施方式中针对HTTPS加密网站访问的过滤方法的控制流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明技术方案的主要思想是通过抓取用户对网站访问所产生数据包,选择证书交互数据包并解析证书内容,验证后提取URL信息,并通过预定URL库对所提取的信息进行分类过滤,根据预先设定的规则进行后续处理。
下图是本发明具体实施方式中访问HTTPS加密网站过程中网址过滤的流程图。如下图所示,该过滤流程包括以下步骤:
步骤1、用户发起HTTPS连接,并产生数据包。
步骤2、抓取用户访问互联网数据包。
步骤3、判断识别所抓取数据包属于某个网络连接。
通过确认该数据包所属数据流,检查该数据包是否超过系统对数据流扫描包数目的限制,从而判断识别所抓取的数据包属于具体某个连接所产生的数据包。如果所抓取的数据包在不超过系统对数据流扫描包数目的限制之内成功识别出所属连接,转至步骤5,如果所抓取的数据包没有在系统对数据流扫描包数目的限制之内识别出所属连接,转至步骤4。
步骤4、退出。
步骤5、判断所抓取的数据包是否属于HTTPS协议下的数据包。
通过抓取的数据包所在端口,从而判断数据包是否属于HTTPS协议下的数据包。如果所抓取的数据包属于HTTPS协议,转至步骤6,如果所抓取数据包不属于HTTPS协议,转至步骤4。
步骤6、判断数据包是否属于HTTPS协议下的交互认证数据包,此数据包中包括网站证书等信息。如果该数据包是交互认证数据包,转至步骤7,如果该数据包不是交互认证数据包,转至步骤4。
步骤7、获取认证数据包中的网站证书信息。
步骤8、解析网站证书内容。扫描此数据包的内容,如果数据包里连续出现某特定URL域标示字符串,为URL域的标示,该标示后即为URL域名。
步骤9、获取证书中内嵌的URL域信息,如果顺利获取到URL信息,转至步骤10,如果没有获取到URL信息,转至步骤4。
步骤10、验证URL信息是否正确,通过比对解析出的认证报文网站证书中的URL和浏览器输入的URL是否一致,如果比对一致说明证书中的URL信息就是浏览器中的URL,在证书提取中的URL是正确的URL。如果URL信息验证一致,转至步骤11,如果URL信息不一致,转至步骤4。
步骤11、提取URL条目。
步骤12、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。
步骤13、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
机译: 一种输入网址网址的方法,以简化URL代码
机译: 针对耶尔森氏菌的疫苗,包含一种或两种抗体,一种针对耶尔森氏菌F1-抗原,一种针对另一种,针对耶尔森氏菌V-抗原。
机译: 针对耶尔森氏菌的疫苗,包含一种或两种抗体,一种针对耶尔森氏菌F1-抗原,一种针对另一种,针对耶尔森氏菌V-抗原。