首页> 中国专利> 网站访问记录的分析方法与网站访问记录的分析装置

网站访问记录的分析方法与网站访问记录的分析装置

摘要

本发明提供了一种网站访问记录的分析方法与网站访问记录的分析装置。其中,网站访问记录的分析方法包括以下步骤:获取对目标网站的访问请求记录;判断访问请求记录中的目标域名是否与目标网站的子域名匹配;根据判断结果将访问请求记录保存到不同的数据表中。利用本发明的技术方案,将与子域名匹配的访问记录和不匹配的访问记录分别保存在不同的数据表中,以分别进行相应的处理。由于进行了有针对性的区分,在进行具体应用时减小了数据量,提高了数据处理效率。

著录项

  • 公开/公告号CN103701951A

    专利类型发明专利

  • 公开/公告日2014-04-02

    原文格式PDF

  • 申请/专利号CN201310741720.9

  • 发明设计人 董方;

    申请日2013-12-27

  • 分类号H04L29/12(20060101);H04L29/06(20060101);G06F17/30(20060101);

  • 代理机构北京智汇东方知识产权代理事务所(普通合伙);

  • 代理人康正德;薛峰

  • 地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)

  • 入库时间 2024-02-19 23:15:09

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-23

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04L29/12 变更前: 变更后: 申请日:20131227

    专利权人的姓名或者名称、地址的变更

  • 2018-03-06

    授权

    授权

  • 2016-12-14

    专利申请权的转移 IPC(主分类):H04L29/12 登记生效日:20161122 变更前: 变更后: 申请日:20131227

    专利申请权、专利权的转移

  • 2014-04-30

    实质审查的生效 IPC(主分类):H04L29/12 申请日:20131227

    实质审查的生效

  • 2014-04-02

    公开

    公开

说明书

技术领域

本发明涉及互联网,特别是涉及一种网站访问记录的分析方法与网站访问记录的分析装置。

背景技术

网络中的地址方案分为两套:IP地址系统和域名地址系统。这两套地址系统存在着对应的关系。IP地址用二进制数来表示,每个IP地址长32比特,由4个小于256的数字组成,数字之间用点间隔。由于IP地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上又发展出一种符号化的地址方案,来代替数字型的IP地址。每一个符号化的地址都与特定的IP地址对应,这样网络上的资源访问起来就容易得多了。这个与网络上的数字型IP地址相对应的字符型地址,就被称为域名。

以一个常见的域名为例说明,百度网址是由二部分组成,标号“百度”是这个域名的主体,而最后的标号“com”则是该域名的后缀,代表的这是一个com国际域名,是顶级域名。

二级域名是顶级域名(一级域名)的下一级,域名整体包括两个“.”。例如“www.baidu.com”、“music.baidu.com”、“image.baidu.com”都是百度网站的二级域名。二级域名是指由域名使用者自己设计的,能够体现使用者的特殊性,并据以同其他人的域名相区别的字符串。

域名与IP地址的转换工作由域名解析系统(Domain Name System,简称DNS)完成,域名解析系统中配置有于域名与IP地址的对应关系。现有的网站访问记录的分析方法将向目标网站发送的所有访问请求按照一级域名进行记录和分析,会产生较多的垃圾数据,较大数据量占用了较多的计算资源,而且无法实现精细化分析。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网站访问记录的分析装置和相应的网站访问记录的分析方法。本发明一个进一步的目的是要使得过滤网站访问记录中的无效数据,实现精细化分析。

依据本发明的一个方面,提供了网站访问记录的分析方法。该网站访问记录的分析方法包括以下步骤:获取对目标网站的访问请求记录;判断访问请求记录中的目标域名是否与目标网站的子域名匹配;根据判断结果将访问请求记录保存到不同的数据表中。

可选地,判断访问请求记录中的目标域名是否与目标网站的子域名匹配包括:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。

可选地,获取目标网站的子域名列表包括:从域名解析系统中获取目标网站配置的所有子域名,以得到子域名列表。

可选地,根据判断结果将访问请求记录保存到不同的数据表中包括:若判断结果为是,将访问请求记录按照子域名分类存储至第一数据表中;若判断结果为否,将访问请求记录存储至第二数据表中。

可选地,将访问请求记录按照子域名分类存储至第一数据表中之后还包括:按照第一数据表中记录的数据,生成目标网站的访问分析报表。

可选地,,将访问请求记录存储至第二数据表中之后还包括:对第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。

根据本发明的另一个方面,还提供了一种网站访问记录的分析装置。该网站访问记录的分析装置包括:获取模块,用于获取对目标网站的访问请求记录;判断模块,用于判断访问请求记录中的目标域名是否与目标网站的子域名匹配;保存模块,用于根据判断结果将访问请求记录保存到不同的数据表中。

可选地,判断模块被配置为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。

可选地,保存模块包括:第一数据表保存子模块,用于在判断模块的判断结果为是的情况下,将访问请求记录按照子域名分类存储至第一数据表中;第二数据表保存子模块,用于在判断模块的判断结果为否的情况下,将访问请求记录存储至第二数据表中。

可选地,以上网站访问记录的分析装置还包括:报表分析模块,用于按照第一数据表中记录的数据,生成目标网站的访问分析报表。

可选地,以上网站访问记录的分析装置还包括:特征提取模块,用于对第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。

本发明的网站访问记录的分析方法和装置将访问记录与目标网站配置的子域名进行匹配,将与子域名匹配的访问记录和不匹配的访问记录分别保存在不同的数据表中,以分别进行相应的处理。由于进行了有针对性的区分,在进行具体应用时减小了数据量,提高了数据处理效率。

进一步地,本发明的网站访问记录的分析方法由于进行了子域名的匹配计算,从而可以将网站访问记录按照子域名进行分类处理,提高了数据分析的精细程度。

又进一步地,本发明的网站访问记录的分析方法可以利用与子域名不匹配的访问记录的数据表,对泛解析的访问记录进行分析,提取出其中的恶意访问特征,为网络安全防护提供了数据支持。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是根据本发明一个实施例的网站访问记录的分析装置100的示意图;

图2是根据本发明一个实施例的网站访问记录的分析方法的示意图;以及

图3是根据本发明一个实施例的网站访问记录的分析方法的流程图;

具体实施方式

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

图1是根据本发明一个实施例的网站访问记录的分析装置100的示意图,该网站访问记录的分析装置100一般性地可以包括:获取模块110,判断模块120,保存模块130。在一些优选方案和特殊的使用环境下,本实施例的网站访问记录的分析装置100可以增加设置报表分析模块140和特征提取模块150,保存模块130可以分别设置有第一数据表保存子模块131、第二数据表保存子模块132。

在以上模块中,获取模块110用于获取对目标网站的访问请求记录;判断模块120用于判断访问请求记录中的目标域名是否与目标网站的子域名匹配;保存模块130用于根据判断结果将访问请求记录保存到不同的数据表中。

域名与IP地址的转换工作由域名解析系统(Domain Name System,简称DNS)完成,域名解析系统中配置有于域名与IP地址的对应关系。为了让域名支持无限的子域名,可以采用泛解析方式,支持将在域名解析里面设置通配符“*”,将顶级域名下的所有二级域名对应到同一个IP上去,例如对应值网站主页对应的IP上。也就是泛解析支持利用通配符“*”来做次级域名以实现所有的次级域名均指向同一IP地址,

仍以百度为例,在支持泛解析的情况下,可以将所有出子域名之外的包括baidu.com的网址均对应至百度主页“www.baidu.com”的IP地址下,也就将“123.baidu.com”、“admin.baidu.com”等不存在的网址也对应到百度主页上,使用泛解析可以域名支持无限的子域名,并可以解决部分用户错误输入导致的网站不能访问的问题。

然而使用泛解析的危害性较大,首先会将带来大量的垃圾数据,例如黑客可以随机生成大量的无效域名对目标网站进行攻击,另外,还会引起搜索引擎对网站的二级域名进行降权处理,即不收录二级域名页面或降低收录二级域名页面的数量。

对于目标网站的访问请求分析装置而言,将泛解析的数据进行记录和分析,会将大量无效的请求数据保存到请求记录中,造成数据库中数据量增大,影响了数据处理效率。

本实施例的网站访问记录的分析装置100在进行数据分析时,获取模块110得到访问请求记录数据后,需要经过判断模块120的判断,由保存模块130按照判断模块120的判断结果进行分类保存,减小了无效数据对数据分析的干扰,并且提高了数据处理的效率。

其中判断模块120的一种配置方式为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。以上目标网站的子域名列表可以由用户在联网应用服务提供商中的配置数据得出,这些子域名分别对应着网站不同的页面,例如对于百度而言,其配置的有效子域名包括:“tieba.baidu.com”、“news.baidu.com”、“www.baidu.com”、“map.baidu.com”、“v.baidu.com”、“image.baidu.com”、“music.baidu.com”、“zhidao.baidu.com”可以将按照这些有效的子域名生成子域名列表,当获取模块110获取到的访问请求记录中的域名是否在以上子域名列表中存在一致的条目,例如当前访问请求记录的域名为“image.baidu.com”,则认为该请求记录属于第一类数据,而对于访问访问请求记录的域名为“admine.baidu.com”,则认为该请求记录是第二类数据。

相应地,第一数据表保存子模块131用于存储第一类数据,也就是在判断模块120的判断结果为是的情况下,将访问请求记录按照子域名分类存储至第一数据表中;第二数据表保存子模块132用于存储第二类数据,也就是判断模块120的判断结果为否的情况下,将访问请求记录按照子域名分类存储至第二数据表中。以上第一数据表和第二数据表可以分别在不同的数据库中建立,也可以是同一数据库的不同数据表。

以上第一类数据和第二类数据可以作为不同用途的数据源,其中,第一数据表中的数据可以由报表分析模块140用于生成目标网站的访问分析报表。第二数据表中的数据可以由特征提取模块150进行分析,提取出恶意请求特征,以用于网站安全防护。

其中,第一数据表中数据都是网站配置的子域名对应的请求数据,对此类数据进行分析,可以客观反映用户对网站的请求情况,而且经过了数据匹配,以上数据可以按照子域名进行分类,实现了精细化数据分析。例如可将实时的请求按照子域名生成报表,供网站运营人员插卡。

第二数据表中的数据是泛解析的域名,并不属于网站有效配置的子域名,其中可能包括有大量的黑客攻击数据,对这类数据进行分析,提取出恶意请求特征,可以有助于网站的安全防护。

本发明实施例还提供了一种网站访问记录的分析方法。该网站访问记录的分析方法可以由以上实施例中介绍的网站访问记录的分析装置100执行,实现网站访问数据的分类处理和保存。图2是根据本发明一个实施例的网站访问记录的分析方法的示意图,该网站访问记录的分析方法包括以下步骤:

步骤S202,获取对目标网站的访问请求记录;

步骤S204,判断访问请求记录中的目标域名是否与目标网站的子域名匹配;

步骤S206,根据判断结果将访问请求记录保存到不同的数据表中。

其中,步骤S204的一种实现方式为:获取目标网站的子域名列表;将子域名列表中的条目与目标域名进行比较,判断是否存在与目标域名一致的条目。其中获取目标网站的子域名列表的步骤可以从域名解析系统中获取目标网站配置的所有子域名,生成子域名列表。

步骤S206的一种实现方式为:若步骤S204的判断结果为是,将访问请求记录按照子域名分类存储至第一数据表中;若步骤S204的判断结果为否,将访问请求记录存储至第二数据表中。其中,按照第一数据表中记录的数据可以用于生成目标网站的访问分析报表。第二数据表中记录的数据可进一步进行分析,提取出恶意请求特征,以用于网站安全防护。

图3是根据本发明一个实施例的网站访问记录的分析方法的流程图,该实施例的网站访问记录的分析方法的一种实现流程为:

步骤S302,获取对目标网站的访问请求记录;

步骤S304,判断访问请求记录中的目标域名与目标网站配置的有效子域名是否一致;

步骤S306,若步骤S304的判断结果为是,将访问请求记录保存至第一数据表,用于生成请求记录报表;

步骤S308,若步骤S304的判断结果为否,将访问请求记录保存至第二数据表。对第二数据表中的数据进行进一步分析,如果发现在DNS中配置了泛解析,则向用户告知泛解析的危害,及时提醒用户。

以下一个具体的网站为例对本发明的网站访问记录的分析方法进行说明。例如网站根域名为“ABDCE.COM”。表1是该网站配置的所有子域名的列表。

表1

子域名名称news.ABCDE.com新闻频道www.ABCDE.com主页bbs.ABCDE.com论坛Vedio.ABCDE.com视频
网站访问记录的分析方法对该网站进行访问流量分析,分别在两台数据服务器中建立了数据表。

假设在第一时刻获取到了一条访问请求,其域名为bbs.ABCDE.com,经过判断与该网站的论坛页面子域名一致,则将该访问请求保存至第一数据服务器中建立的热数据表中,在后续生成的报表中,将论坛子域名的访问量加一。

假设在第二时刻获取到了一条访问请求,其域名为admin.ABCDE.com,经过判断没有该网站的子域名与该域名一致,则将该访问请求保存至第二数据服务器中建立的冷数据表中,经过分析,如果发现在某一时段内,由一个请求方发送了大量的admin的子域名访问请求,则可以将该请求源发送的admin子域名的访问请求作为疑似的恶意请求,用于后续的安全防护。

利用本发明实施例的技术方案,将与子域名匹配的访问记录和不匹配的访问记录分别保存在不同的数据表中,以分别进行相应的处理。由于进行了有针对性的区分,在进行具体应用时减小了数据量,提高了数据处理效率。

进一步地,本发明的网站访问记录的分析方法由于进行了子域名的匹配计算,从而可以将网站访问记录按照子域名进行分类处理,提高了数据分析的精细程度。

又进一步地,本发明的网站访问记录的分析方法可以利用与子域名不匹配的访问记录的数据表,对泛解析的访问记录进行分析,提取出其中的恶意访问特征,为网络安全防护提供了数据支持。

本发明的实施例公开了:

A1.一种网站访问记录的分析方法,包括:

获取对目标网站的访问请求记录;

判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配;

根据判断结果将所述访问请求记录保存到不同的数据表中。

A2.根据A1所述的方法,其中,判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配包括:

获取所述目标网站的子域名列表;

将所述子域名列表中的条目与所述目标域名进行比较,判断是否存在与所述目标域名一致的条目。

A3.根据A2所述的方法,其中,获取所述目标网站的子域名列表包括:从域名解析系统中获取所述目标网站配置的所有子域名,以得到所述子域名列表。

A4.根据A1至A3中任一项所述的方法,其中,根据判断结果将所述访问请求记录保存到不同的数据表中包括:

若所述判断结果为是,将所述访问请求记录按照所述子域名分类存储至第一数据表中;

若所述判断结果为否,将所述访问请求记录存储至第二数据表中。

A5.根据A4所述的方法,其中,将所述访问请求记录按照所述子域名分类存储至第一数据表中之后还包括:

按照所述第一数据表中记录的数据,生成所述目标网站的访问分析报表。

A6.根据A4所述的方法,其中,将所述访问请求记录存储至第二数据表中之后还包括:

对所述第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。

B7.一种网站访问记录的分析装置,包括:

获取模块,用于获取对目标网站的访问请求记录;

判断模块,用于判断所述访问请求记录中的目标域名是否与所述目标网站的子域名匹配;

保存模块,用于根据判断结果将所述访问请求记录保存到不同的数据表中。

B8.根据B7所述的装置,其中,所述判断模块被配置为:

获取所述目标网站的子域名列表;

将所述子域名列表中的条目与所述目标域名进行比较,判断是否存在与所述目标域名一致的条目。

B9.根据B7或B8所述的装置,其中,所述保存模块包括:

第一数据表保存子模块,用于在所述判断模块的判断结果为是的情况下,将所述访问请求记录按照所述子域名分类存储至第一数据表中;

第二数据表保存子模块,用于在所述判断模块的判断结果为否的情况下,将所述访问请求记录存储至第二数据表中。

B10.根据B9所述的装置,还包括:

报表分析模块,用于按照所述第一数据表中记录的数据,生成所述目标网站的访问分析报表。

B11.根据B9所述的装置,其中,还包括:

特征提取模块,用于对所述第二数据表中记录的数据进行分析,提取出恶意请求特征,以用于网站安全防护。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网站访问记录的分析装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号