首页> 中国专利> 一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置

一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置

摘要

本发明提供了一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置,涉及网站信誉度评估的技术领域,包括获取待评估网站在当前时刻的第一信誉度,其中,第一信誉度为根据待评估网站的网站特征得到的信誉度;获取待评估网站在当前时刻的第二信誉度,其中,第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系;根据第一信誉度和第二信誉度,确定待评估网站的目标信誉。本发明缓解了现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

著录项

  • 公开/公告号CN107547552A

    专利类型发明专利

  • 公开/公告日2018-01-05

    原文格式PDF

  • 申请/专利权人 杭州安恒信息技术有限公司;

    申请/专利号CN201710803281.8

  • 发明设计人 金立峰;范渊;

    申请日2017-09-07

  • 分类号

  • 代理机构北京超凡志成知识产权代理事务所(普通合伙);

  • 代理人苏胜

  • 地址 310051 浙江省杭州市滨江区通和路68号浙江中财大厦15层

  • 入库时间 2023-06-19 04:10:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-21

    授权

    授权

  • 2020-02-14

    著录事项变更 IPC(主分类):H04L29/06 变更前: 变更后: 申请日:20170907

    著录事项变更

  • 2018-01-30

    实质审查的生效 IPC(主分类):H04L29/06 申请日:20170907

    实质审查的生效

  • 2018-01-05

    公开

    公开

说明书

技术领域

本发明涉及网站信誉度评估技术领域,尤其是涉及一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置。

背景技术

网络安全和信息化是我国经济社会健康、稳定发展驱动之双轮、一体之两翼。网络安全已上升为国家战略,并且成为网络强国建设的关键核心。在公共网络中扮演着重要角色的网站,在各行业领域中都发挥着重要的价值,尤其是在内容公开、互动交流、线上业务开展等方面起着至关重要的作用,因此,为网站安全考虑,对网站进行信誉评估和分析显得十分必要、重要和迫切。

然而,网站具有建设门槛低,域名注册成本低,内容发布要求低,网站安全能力低的四低问题,这四低问题使网站存在灰色地带,其中,私自搭建的网站或者非法入侵合法网站使得黄赌毒、邪教、暴力、反党、反社会、非法广告等负面内容充斥于网络中,这将会诱导犯罪行为和破坏稳定团结的氛围,引发社会的不和谐,给网络安全造成极大的负面影响。

但是,如何全面考察互联网中网站的信誉,是一个业界难题。一方面,网站信誉本身是一个错综复杂的问题,不仅有运营者本身问题,还有可能存在被非法入侵引发的问题等;另一方面,网站性质相差较 大,标准不一,内容差异大。针对上述现象,现有技术中缺乏一种对网站信誉度进行准确考量的统一方法。

发明内容

有鉴于此,本发明的目的在于提供一种一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置,以缓解现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

第一方面,本发明实施例提供了一种基于网站特征识别和关系拓扑的网站信誉度评估方法,包括:

获取待评估网站在当前时刻的第一信誉度,其中,所述第一信誉度为根据所述待评估网站的网站特征得到的信誉度;

获取所述待评估网站在当前时刻的第二信誉度,其中,所述第二信誉度为根据所述待评估网站的拓扑关系得到的信誉度,所述拓扑关系为根据所述待评估网站的域名和IP地址所构建的拓扑关系;

根据所述第一信誉度和所述第二信誉度,确定所述待评估网站的目标信誉。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,获取待评估网站在当前时刻的第一信誉度,包括:

获取所述待评估网站的属性信息,其中,所述属性信息包括:内容属性、备案属性和链接属性;

对所述内容属性进行信誉度评分,得到第一分值;

对所述备案属性进行信誉度评分,得到第二分值;

对所述链接属性进行信誉度评分,得到第三分值;

对所述第一分值、所述第二分值、所述第三分值进行加权平均值计算,得到第一加权平均值,并将所述第一加权平均值确定为所述第 一信誉度。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,对所述内容属性进行信誉度评分,得到第一分值,包括:

根据所述内容属性,确定非法内容以及间隔时长,其中,所述间隔时长为所述非法内容最近一次在所述待评估网站内容中出现的时刻和当前时刻的间隔时长;

根据所述非法内容,确定所述非法内容对所述待评估网站的信誉度评估的影响权重;

通过第一公式C1=C1tmp*ax计算所述第一分值,其中,C1表示所述第一分值,x表示所述间隔时长,C1tmp表示所述影响权重,a表示第一预设参数。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,对所述备案属性进行信誉度评分,得到第二分值,包括:

根据所述备案属性,获取所述备案属性的预设分值,其中,所述预设分值为预先为所述备案属性设置的信誉度分值;

将所述预设分值确定为所述第二分值。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,对所述链接属性进行信誉度评分,得到第三分值,包括:

从所述链接属性中提取所述待评估网站网页中包含的超链接接口,并根据所述超链接接口确定所述待评估网站的至少一个链接网站;

获取所述至少一个链接网站中每个链接网站的信誉度评估分值;

从多个所述信誉度评估分值中提取目标信誉度评估分值,其中,所述目标信誉度评估分值为多个所述信誉度评估分值中的最大值;

将所述目标信誉度评估分值确定为所述第三分值。

结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,获取所述待评估网站在当前时刻的第二信誉度,包括:

获取至少一个第一子分值,并根据所述至少一个第一子分值计算第四分值,其中,每个所述第一子分值为第一目标网站的信誉度评估分值,所述第一目标网站为所述IP地址相对应的网站,且所述第一目标网站与所述待评估网站不同;

获取至少一个第二子分值,并根据所述至少一个第二子分值计算第五分值,其中,每个所述第二子分值为所述待评估网站的一个IP地址的信誉度评估分值;

获取至少一个第三子分值,并根据所述至少一个第三子分值计算第六分值,其中,每个所述第三子分值为第二目标网站的信誉度评估分值,所述第二目标网站为和所述待评估网站具有相同主域名的网站,且所述第二目标网站和所述待评估网站不同;

对所述第四分值、所述第五分值、所述第六分值进行加权平均值计算,得到第二加权平均值,并将所述第二加权平均值确定为所述第二信誉度。

结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,根据所述至少一个第一子分值计算第四分值,包括;

对所述至少一个第一子分值进行加权平均值计算,得到第一子加权平均值,并将所述第一子加权平均值确定为所述第四分值。

结合第一方面的第五种可能的实施方式,本发明实施例提供了第 一方面的第七种可能的实施方式,其中,根据所述至少一个第二子分值计算第五分值,包括;

对所述至少一个第二子分值进行加权平均值计算,得到第二子加权平均值。

结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,根据所述至少一个第三子分值计算第六分值,包括:

通过第二公式计算所述第六分值,其中,C6表示所述第六分值,L表示所述第二目标网站的数量,Cni表示所述第二目标网站中第二目标网站i的第三子分值,P为根据所述待评估网站的域名种类而得到的第二预设参数,λ11为第一预设权重,λ12为第二预设权重。

第二方面,本发明实施例还提供了一种基于网站特征识别和关系拓扑的网站信誉度评估装置,包括:

第一获取模块,用于获取待评估网站在当前时刻的第一信誉度,其中,所述第一信誉度为根据所述待评估网站的网站特征得到的信誉度;

第二获取模块,用于获取所述待评估网站在当前时刻的第二信誉度,其中,所述第二信誉度为根据所述待评估网站的拓扑关系得到的信誉度,所述拓扑关系为根据所述待评估网站的域名和IP地址所构建的拓扑关系;

确定模块,用于根据所述第一信誉度和所述第二信誉度,确定所述待评估网站的目标信誉。

本发明实施例带来了以下有益效果:该种基于网站特征识别和关系拓扑的网站信誉度评估方法包括:获取待评估网站在当前时刻的第 一信誉度和第二信誉度,然后根据第一信誉度和第二信誉度确定待评估网站的目标信誉。

其中,第一信誉度为根据待评估网站的网站特征得到的信誉度,即,第一信誉度是由待评估网站自身的特征得到的信誉度;第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系,首先,每一个网站都有域名和IP地址,而网络中常常存在通过与健康网站相同、相似或相关联的域名/IP地址来在网络上散布非法内容的现象,因而第一信誉度结合第二信誉度来确定目标信誉,是一种普遍适用的方法,且将影响网站荣誉的因素考虑地更加全面,有利于更加准确地对待评估网站进行信誉度评价,从而缓解了现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的一种基于网站特征识别和关系拓扑的网站信誉度评估方法的流程图;

图2为本发明实施例一提供的另一种基于网站特征识别和关系拓扑的网站信誉度评估方法的流程图;

图3为本发明实施例二提供的一种基于网站特征识别和关系拓扑的网站信誉度评估装置的示意图;

图4为本发明实施例二提供的另一种基于网站特征识别和关系拓扑的网站信誉度评估装置的示意图。

图标:1-第一获取模块;2-第二获取模块;3-确定模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

网站信誉本身是一个错综复杂的问题,不仅有运营者本身问题,还有可能存在被非法入侵引发的问题等;另一方面,网站性质相差较大,标准不一,内容差异大。针对上述现象,现有技术中缺乏一种对网站信誉度进行准确考量的统一方法。基于此,本发明实施例提供的一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置,可以缓解了现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

实施例一

本发明实施例提供的一种基于网站特征识别和关系拓扑的网站 信誉度评估方法,如图1所示,包括:

步骤S102,获取待评估网站在当前时刻的第一信誉度,其中,第一信誉度为根据待评估网站的网站特征得到的信誉度;

步骤S104,获取待评估网站在当前时刻的第二信誉度,其中,第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系;

步骤S106,根据第一信誉度和第二信誉度,确定待评估网站的目标信誉。

具体地,可以利用爬虫系统不间断的爬取全球的网站信息,以保证获取到的第一信誉度和第二信誉度的实时性,这里当前时刻的第一信誉度和第二信誉度是指获取到的最新的信誉度信息,具体可以通过设置爬虫爬取的速率来保证第一信誉度和第二信誉度的实时性。

需要说明的是,网站是否是不良网站,是从网站是否会对网民造成不良影响来分辨的,网民受网站的影响主要来自网站自身内容以及与网站相关联的网站内容,这里的关联包括通过超链接进行的关联、通过IP地址或域名进行的关联。

本发明实施例中,第一信誉度为根据待评估网站的网站特征得到的信誉度,即,第一信誉度是由待评估网站自身的特征得到的信誉度;第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系,首先,每一个网站都有域名和IP地址,而网络中常常存在通过与健康网站相同、相似或相关联的域名/IP地址来在网络上散布非法内容的现象,因而第一信誉度结合第二信誉度来确定目标信誉,是一种普遍适用的方法,且将影响网站荣誉的因素考虑地更加全面,有利于更加准确地对待评估网站进行信誉度评价,从而缓解了现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

本发明实施例的一个可选实施方式中,获取待评估网站在当前时刻的第一信誉度,包括:

获取待评估网站的属性信息,其中,属性信息包括:内容属性、备案属性和链接属性;

对内容属性进行信誉度评分,得到第一分值;

对备案属性进行信誉度评分,得到第二分值;

对链接属性进行信誉度评分,得到第三分值;

对第一分值、第二分值、第三分值进行加权平均值计算,得到第一加权平均值,并将第一加权平均值确定为第一信誉度。

需要说明的是,内容属性是指:直接发布于网站页面的内容,能让网民通过阅读即可直接获取信息的文字、图片的属性,而链接属性是网页中的超链接接口的属性,备案属性是指网站注册备案时的属性。

此外,同样的网页内容在不同备案属性的网站会有起到不同的作用的可能。本发明实施例通过包括内容属性、备案属性和链接属性的属性信息来确定第一信誉度,更加全面,也更加合理,有利于保障第一信誉度的精准度。

具体地,可以通过V1=λ1C12C23C3来计算第一信誉度,其中,V1表示第一信誉度,C1表示第一分值,C2表示第二分值,C3表示第三分值,λ1、λ2、λ3依次为第一分值、第二分值、第三分值三个分值的权重因子。这里第一信誉度的值越小表示待评估网站的信誉度越高。根据内容属性、备案属性和链接属性对待评估网站信誉度的影响权重,λ1、λ2、λ3可以依次取值为0.6、0.2、0.2。

需要强调的是,一个网站中的直接发布于网站页面的内容是否健康或合法是决定一个网站对网民影响的的最直接的因素,因而,上述 第一分值的权重因子大于第二分值和第三分值,这里λ1、λ2、λ3的取值是本发明的一个可选取值方式,但不是唯一的取值方式。

本发明实施例的另一个可选实施方式中,根据内容属性,确定非法内容以及间隔时长,其中,间隔时长为非法内容最近一次在待评估网站内容中出现的时刻和当前时刻的间隔时长;

根据非法内容,确定非法内容对待评估网站的信誉度评估的影响权重;

通过第一公式C1=C1tmp*ax计算第一分值,其中,C1表示第一分值,x表示间隔时长,C1tmp表示影响权重,a表示第一预设参数。

具体地,a为一个小于1的值,a可以取值为0.95;C1tmp是非法内容类型对网站信誉度评分影响的权重,具体取值可以如下:

(1)待评估网站自身主旨为非法内容,例如黄赌毒、邪教等,则C1tmp=1;

(2)待评估网站由于被入侵导致内容带有黄赌毒、邪教等非法信息,则C1tmp=0.5;

(3)待评估网站内容为合法健康的内容,则C1tmp=0.

在a和C1tmp得到如上取值的情况下,x越大则C1越小,即,间隔时长越长待评估网站的信誉度越高,考虑到内容属性对网站信誉度影响的重要性及间隔时长对内容属性的重要性,x作为a的指数来影响第一分值。

本发明实施例的另一个可选实施方式中,对备案属性进行信誉度评分,得到第二分值,包括:

根据备案属性,获取备案属性的预设分值,其中,预设分值为预先为备案属性设置的信誉度分值;

将预设分值确定为第二分值。

具体地,考虑到备案属性较正规的网站,内容为健康内容的概率更大,第二分值可选如下取值:

(1)待评估网站备案为政务、教育、事业单位,C2=0;

(2)待评估网站备案为企业,C2=0.2;

(3)待评估网站备案为除政务、教育、事业单位、企业之外的类型,C2=0.4;

(4)待评估网站无备案,C2=1。

本发明实施例的另一个可选实施方式中,对链接属性进行信誉度评分,得到第三分值,包括:

从链接属性中提取待评估网站网页中包含的超链接接口,并根据超链接接口确定待评估网站的至少一个链接网站;

获取至少一个链接网站中每个链接网站的信誉度评估分值;

从多个信誉度评估分值中提取目标信誉度评估分值,其中,目标信誉度评估分值为多个信誉度评估分值中的最大值;

将目标信誉度评估分值确定为第三分值。

由于待评估网站的超链接接口对应的多个网站中,每个网站都具有一个完整网站的内容,影响力很大,为了能保证将信誉度不好的网站找出来,因而,将信誉度最差的网站的信誉度评估分值作为第三分值。

本发明实施例的另一个可选实施方式中,获取待评估网站在当前时刻的第二信誉度,包括:

获取至少一个第一子分值,并根据至少一个第一子分值计算第四分值,其中,每个第一子分值为第一目标网站的信誉度评估分值,第一目标网站为IP地址相对应的网站,且第一目标网站与待评估网站不同;

获取至少一个第二子分值,并根据至少一个第二子分值计算第五分值,其中,每个第二子分值为待评估网站的一个IP地址的信誉度评估分值;

获取至少一个第三子分值,并根据至少一个第三子分值计算第六分值,其中,每个第三子分值为第二目标网站的信誉度评估分值,第二目标网站为和待评估网站具有相同主域名的网站,且第二目标网站和待评估网站不同;

对第四分值、第五分值、第六分值进行加权平均值计算,得到第二加权平均值,并将第二加权平均值确定为第二信誉度。

具体地,可以通过V2=λ4C45C56C6来计算第一信誉度,其中,V2表示第二信誉度,C4表示第四分值,C5表示第五分值,C6表示第六分值,λ4、λ5、λ6依次为第四分值、第五分值、第六分值三个分值的权重因子。这里第二信誉度的值越小表示待评估网站的信誉度越高。λ4、λ5、λ6可以依次取值为0.3、0.3、0.4。

需要说明的是,一个网站对应有一个域名,一个网站可以对应有多个IP地址,而一个IP地址对应有多个域名。

假设,待评估网站为W0网站,W0网站具有IP(A)和IP(B)两个IP地址,W网站的域名为Y1,其中,IP(A)地址对应有W0网站、W1网站、W2网站三个网站,IP(B)地址只对应有W0网站,Y1有主域名Y0,Y0有子域名Y1和Y2,那么,

(1)第一目标网站为W1网站和W2网站。

(2)第二子分值为IP(A)或IP(B)地址的信誉度评估分值,这里需要说明的是,IP(A)地址的信誉度评估分值是对用户访问IP(A)地址的过程中受到不良影响的评分,具体可以由当前时刻的前一时刻计算出的信誉度评估分值来决定,其中,前一时刻计算出的信誉度评估 分值为和IP(A)地址相关联网站的信誉度评估分值,IP(B)地址的信誉度评估分值的计算原理与IP(A)地址信誉度评估分值相同。

(3)第二目标网站为域名Y2的网站。

本发明实施例中,通过IP地址反查来获取和待评估网站相关联的网站以及它们的信誉度评估分值,并得到由这些相关网站决定的第二信誉度。

本发明实施例的另一个可选实施方式中,根据至少一个第一子分值计算第四分值,包括;

对至少一个第一子分值进行加权平均值计算,得到第一子加权平均值,并将第一子加权平均值确定为第四分值。

需要说明的是,至少一个第一子分值进行加权平均值计算时,如果权重因子的比值为1,则第四分值是至少一个第一子分值的平均值。这里加权平均值计算用到的权重因子的比值的具体值可因第一目标网站对信誉度评分的影响来调节。

本发明实施例的另一个可选实施方式中,根据至少一个第二子分值计算第五分值,包括;

对至少一个第二子分值进行加权平均值计算,得到第二子加权平均值,并将第二子加权平均值确定为第五分值。

同样,需要说明的是,至少一个第二子分值进行加权平均值计算时,如果权重因子的比值为1,则第五分值是至少一个第二子分值的平均值。这里加权平均值计算用到的权重因子的比值的具体值可因第二目标网站对信誉度评分的影响来调节。

本发明实施例的另一个可选实施方式中,根据至少一个第三子分值计算第六分值,包括:

通过第二公式计算第六分值,其中,C6表>ni表示第二目标网站中第二目标网站i的第三子分值,P为根据待评估网站的域名种类而得到的第二预设参数,λ11为第一预设权重,λ12为第二预设权重。

具体地,如果待评估网站的域名为主域名,则P=0;如果待评估网站的域名为子域名,则P=1。此外,λ11和λ12可以依次取0.7、0.3。

本发明实施例的另一个可选实施方式中,如图2所示,在根据所述第一信誉度和所述第二信誉度,确定所述待评估网站的目标信誉之后,基于网站特征识别和关系拓扑的网站信誉度评估方法,还包括:

步骤S107,目标信誉相应的分值是否大于预设分数阈值,其中,在判断结果为是的情况下,执行步骤S108;在判断结果为否的情况下,结束本次对待评估网站进行信誉度评估的过程。

步骤S108,向管理人员发送通知信息,其中,通知信息为待评估网站为不良网站。

具体地,管理人员可以为审核机构、防护平台等服务方的管理人员。本发明实施例通过实时的反馈机制让审核机构、防护平台等下游厂商对有问题的网站进行及时处理。

本发明实施例根据各种因素对待评估网址的信誉度影响权重,在待评估网站的目标信誉过程中分别采用了加法运算、乘法运算、幂指数运算,其中,加法运算的各个加数对应的因素表示对信誉度影响权重相同,乘法运算中通过引入权重因子来确定相应因素的影响权重,幂指数运算的指数对应一个影响权重较大的因素。本发明实施例通过综合考虑网站特征及网站拓扑关系,以及网站特征及网站拓扑关系中各种因素的影响权重,全面且合理地给出了待评估网站的目标信誉。并且,将目标信誉以分值的形式给出,更加直观,具有较强的可比性和评估性。

实施例二

本发明实施例提供的一种基于网站特征识别和关系拓扑的网站信誉度评估装置,如图3所示,包括:

第一获取模块1,用于获取待评估网站在当前时刻的第一信誉度,其中,第一信誉度为根据待评估网站的网站特征得到的信誉度;

第二获取模块2,用于获取待评估网站在当前时刻的第二信誉度,其中,第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系;

确定模块3,用于根据第一信誉度和第二信誉度,确定待评估网站的目标信誉。

在本发明实施例中,第一获取模块1和第二获取模块2分别获取待评估网站在当前时刻的第一信誉度和第二信誉度,然后确定模块3根据第一信誉度和第二信誉度确定待评估网站的目标信誉。

其中,第一信誉度为根据待评估网站的网站特征得到的信誉度,即,第一信誉度是由待评估网站自身的特征得到的信誉度;第二信誉度为根据待评估网站的拓扑关系得到的信誉度,拓扑关系为根据待评估网站的域名和IP地址所构建的拓扑关系,首先,每一个网站都有域名和IP地址,而网络中常常存在通过与健康网站相同、相似或相关联的域名/IP地址来在网络上散布非法内容的现象,因而第一信誉度结合第二信誉度来确定目标信誉,是一种普遍适用的方法,且将影响网站荣誉的因素考虑地更加全面,有利于更加准确地对待评估网站进行信誉度评价,从而缓解了现有技术中缺乏准确考量网站信誉度的统一方法的技术问题。

本发明实施例的一个可选实施方式中,如图4所示,第一获取模块1包括:

获取单元,用于获取待评估网站的属性信息,其中,属性信息包括:内容属性、备案属性和链接属性;

第一评分单元,用于对内容属性进行信誉度评分,得到第一分值;

第二评分单元,用于对备案属性进行信誉度评分,得到第二分值;

第三评分单元,用于对链接属性进行信誉度评分,得到第三分值;

第一计算单元,用于对第一分值、第二分值、第三分值进行加权平均值计算,得到第一加权平均值,并将第一加权平均值确定为第一信誉度。

本发明实施例的另一个可选实施方式中,第一评分单元用于:

根据内容属性,确定非法内容以及间隔时长,其中,间隔时长为非法内容最近一次在待评估网站内容中出现的时刻和当前时刻的间隔时长;

根据非法内容,确定非法内容对待评估网站的信誉度评估的影响权重;

通过第一公式C1=C1tmp*ax计算第一分值,其中,C1表示第一分值,x表示间隔时长,C1tmp表示影响权重,a表示第一预设参数。

本发明实施例的另一个可选实施方式中,第二评分单元用于:

根据备案属性,获取备案属性的预设分值,其中,预设分值为预先为备案属性设置的信誉度分值;

将预设分值确定为第二分值。

本发明实施例的另一个可选实施方式中,第三评分单元用于:

从链接属性中提取待评估网站网页中包含的超链接接口,并根据超链接接口确定待评估网站的至少一个链接网站;

获取至少一个链接网站中每个链接网站的信誉度评估分值;

从多个信誉度评估分值中提取目标信誉度评估分值,其中,目标 信誉度评估分值为多个信誉度评估分值中的最大值;

将目标信誉度评估分值确定为第三分值。

本发明实施例的另一个可选实施方式中,如图4所示,第二获取模块2包括:

第一获取计算单元,用于获取至少一个第一子分值,并根据至少一个第一子分值计算第四分值,其中,每个第一子分值为第一目标网站的信誉度评估分值,第一目标网站为IP地址相对应的网站,且第一目标网站与待评估网站不同;

第二获取计算单元,用于获取至少一个第二子分值,并根据至少一个第二子分值计算第五分值,其中,每个第二子分值为待评估网站的一个IP地址的信誉度评估分值;

第三获取计算单元,用于获取至少一个第三子分值,并根据至少一个第三子分值计算第六分值,其中,每个第三子分值为第二目标网站的信誉度评估分值,第二目标网站为和待评估网站具有相同主域名的网站,且第二目标网站和待评估网站不同;

第二计算单元,用于对第四分值、第五分值、第六分值进行加权平均值计算,得到第二加权平均值,并将第二加权平均值确定为第二信誉度。

本发明实施例的另一个可选实施方式中,第一获取计算单元用于:

对至少一个第一子分值进行加权平均值计算,得到第一子加权平均值,并将第一子加权平均值确定为第四分值。

本发明实施例的另一个可选实施方式中,第二获取计算单元用于:

对至少一个第二子分值进行加权平均值计算,得到第二子加权平均值,并将第二子加权平均值确定为第五分值。

本发明实施例的另一个可选实施方式中,第三获取计算单元用于:

通过第二公式计算第六分值,其中,C6表示第六分值,L表示第二目标网站的数量,Cni表示第二目标网站中第二目标网站i的第三子分值,P为根据待评估网站的域名种类而得到的第二预设参数,λ11为第一预设权重,λ12为第二预设权重。

本发明实施例所提供的基于网站特征识别和关系拓扑的网站信誉度评估方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实 施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号