首页> 中国专利> 社会网络传播拓扑中用户关系构建方法及系统

社会网络传播拓扑中用户关系构建方法及系统

摘要

本发明提供了一种社会网络传播拓扑中用户关系构建方法及系统,所述方法包括:S1.根据某一社会网络事件,获取一个以上所述社会网络事件的转发页面的链接作为种子列表;S2.根据所述种子列表,通过网页解析方式获取所述社会网络事件的传播用户;S3.将所述社会网络事件的传播用户作为关注任务,并将所述关注任务分为N组;S4.预设的N个登录账号模拟N个用户登录,分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;S5.构建群组内的用户关系网络;S6.构建本群组内的用户与其他群组的用户关系网络。本发明可以获取参与网络事件传播的用户之间的关系。

著录项

  • 公开/公告号CN104243234A

    专利类型发明专利

  • 公开/公告日2014-12-24

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN201410461022.8

  • 发明设计人 薛一波;姜京池;易成岐;

    申请日2014-09-11

  • 分类号H04L12/26;H04L29/08;H04L29/06;

  • 代理机构北京路浩知识产权代理有限公司;

  • 代理人李相雨

  • 地址 100084 北京市海淀区清华园100084-82信箱

  • 入库时间 2023-12-18 07:55:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-07-07

    授权

    授权

  • 2015-01-14

    实质审查的生效 IPC(主分类):H04L12/26 申请日:20140911

    实质审查的生效

  • 2014-12-24

    公开

    公开

说明书

技术领域

本发明涉及网络与信息安全技术领域,具体涉及一种社会网络传 播拓扑中用户关系构建方法及系统。

背景技术

社会网络分析技术是信息安全和社会网络领域中的核心技术。其 主要任务是以社会网络中的个人、群体、事件等不同维度进行多角度 分析。

社会媒体的内部结构称为社会网络。社会网络最初起源于1934年 美国社会心理学家Moreno对小群体使用计量学的方法进行的实验研 究。哈佛大学的心理学教授Stanley Milgram在1967年创立了六度分割 理论,其主要思想是在网络上随机抽取的两个人之间所间隔的人不会 超过六个,通过这个理论每一个人物的社交范围都会不断地被放大并 形成大型的网络。70年代,社会网络研究逐渐成为一个新兴的社会学 专业,近年来社交网络的相关研究也成为计算机科学领域的一个研究 热点。

2011年2月,著名的IT风险投资人约翰·杜尔提出一个新兴概念: “SoLoMo”。So(Social,社交);Lo(Local,本地位置);Mo(Mobile, 移动)。在此之后,SoLoMo被一致认为是互联网未来发展趋势,SoLoMo 的概念风靡全世界。

随着社会网络的发展,截止到2014年1月,Facebook、Twitter、 新浪微博的月活跃用户数分别突破了12.3亿、2.55亿和1.438亿。与 此同时,社会网络也产生了大量的用户生成内容(User Generated  Content,UGC)信息,这些UGC信息在社会网络上呈病毒式信息扩 散,而且传播速度呈指数性增长。

社会网络中用户关系是维持人与人交流最普遍和最重要的基本属 性之一,通过用户之间的消息传递使得事件在网络中快速传播。揭示 复杂网络中事件的传播过程对分析网络拓扑结构、理解其功能、发现 其隐含模式、预测其行为都具有十分重要的理论意义和应用价值,在 科学研究、计算机科学、社会、生物和互联网等领域中具有广泛应用。 然而,在事件传播研究领域中,往往分析人员很难获取到参与事件讨 论用户之间的关系,现在还没有一种非常有效的事件传播中用户关系 构建方法。

发明内容

针对现有技术中的缺陷,本发明提供一种社会网络传播拓扑中用 户关系构建方法及系统,以获取参与网络事件传播的用户之间的关系。

第一方面,本发明提供一种社会网络传播拓扑中用户关系构建方 法,所述方法包括:

S1.根据某一社会网络事件,获取一个以上所述社会网络事件的转 发页面的链接作为种子列表;

S2.根据所述种子列表,通过网页解析方式获取所述社会网络事件 的传播用户;

S3.将所述社会网络事件的传播用户作为关注任务,并将所述关注 任务分为N组;

S4.预设的N个登录账号模拟N个用户登录,分别对N组关注任 务执行关注操作,将每个登录账号得到的用户关注列表作为一个群组;

S5.依次进入各群组中用户的共同关注页面,并将共同关注的用户 信息存储至所述群组的用户关注列表中,通过用户之间的关注信息, 构建群组内的用户关系网络;

S6.每个登录账号依次访问其他登录账号得到的群组中的用户,通 过用户之间的关注信息,构建本群组内的用户与其他群组的用户关系 网络。

其中,步骤S2中所述社会网络事件的传播用户包括社会网络事件 的原创用户和转发用户。

其中,所述方法还包括:步骤S2中,在所述通过网页解析方式获 取所述社会网络事件的传播用户之后,对所述社会网络事件的传播用 户进行去重。

其中,步骤S4中所述预设的N个登录账号模拟N个用户登录为:

通过模拟浏览器的形式,以post请求形式与社会网络服务器进行 直接通信,将N个登录账号的用户名和密码信息打包发送至社会网络 服务器端,通过验证后实现N个用户登录。

其中,步骤S4中所述群组为每个登录账号通过网页解析的方式添 加的关注,被关注者为参与社会网络事件的传播用户。

其中,步骤S5和步骤S6中所述用户关系网络为所述社会网络事 件的传播用户之间,通过关注和粉丝两种连接关系形成的节点网络拓 扑。

第二方面,本发明还提供了一种社会网络传播拓扑中用户关系构 建系统,所述系统包括:

种子列表获取模块,用于根据某一社会网络事件,获取一个以上 所述社会网络事件的转发页面的链接作为种子列表;

社会网络事件的传播用户获取模块,用于根据社会网络事件获取 模块发送的种子列表,通过网页解析方式获取所述社会网络事件的传 播用户;

关注任务分配模块,用于将所述社会网络事件的传播用户作为关 注任务分为N组,将N组关注任务分配给N个登录账号;

关注模块,用于使预设的N个登录账号模拟N个用户登录,分别 对N组关注任务执行关注操作,将每个登录账号得到的用户关注列表 作为一个群组;

共同关注获取模块,用于依次进入各群组中用户的共同关注页面, 并将共同关注的用户信息存储至所述群组的用户关注列表中,通过用 户之间的关注信息,构建群组内的用户关系网络;

二级关注获取模块,用于使每个登录账号依次访问其他登录账号 得到的群组中的用户,通过用户之间的关注信息,构建本群组内的用 户与其他群组的用户关系网络。

其中,所述系统还包括重复项识别模块,用于对社会网络事件的 传播用户获取模块获取的社会网络事件的传播用户进行去重。

其中,社会网络事件的传播用户获取模块中所述社会网络事件的 传播用户包括社会网络事件的原创用户和转发用户。

其中,共同关注获取模块和二级关注获取模块中的所述用户关系 网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接 关系形成的节点网络拓扑。

由上述技术方案可知,

本发明的社会网络传播拓扑中用户关系构建方法及系统,采用了 一个有效且高效的框架构建转发网络信息的用户之间的关系,设计了 一种基于共同关注的方法对未知关系的两个用户进行边连接,识别其 是否存在关注属性,同时可以采用多线程的方式并发实现关注操作, 即保证了系统的执行效率又防止了社会网络的异常用户审查机制。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面 将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而 易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通 技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图 获得其他的附图。

图1是本发明实施例一提供的社会网络传播拓扑中用户关系构建 方法的流程图;

图2是社会网络事件传播拓扑中用户关系示例图;

图3是社会网络事件传播拓扑示例图;

图4是本发明实施例三提供的社会网络传播拓扑中用户关系构建 系统结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结 合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、 完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有 作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护 的范围。

图1示出了本发明实施例一提供的社会网络传播拓扑中用户关系 构建方法的流程图,图2和图3分别示出了社会网络事件传播拓扑中 用户关系示例图和社会网络事件传播拓扑示例图。

如图1所示,本实施例的社会网络传播拓扑中用户关系构建方法 如下所述。

步骤101:根据某一社会网络事件,获取一个以上所述社会网络事 件的转发页面的链接作为种子列表。

步骤102:根据所述种子列表,通过网页解析方式获取所述社会网 络事件的传播用户。

在本步骤中,根据所述种子列表,通过网页解析方式获取所述社 会网络事件的传播用户,并将其加入到用户列表中,所述用户列表包 括用户ID、用户名称、主页链接等。

其中,所述社会网络事件的传播用户包括社会网络事件的原创用 户和转发用户。

优选地,在所述通过网页解析方式获取所述社会网络事件的传播 用户之后,对所述社会网络事件的传播用户进行去重。

步骤103:将所述社会网络事件的传播用户作为关注任务,并将所 述关注任务分为N组。

步骤104:预设的N个登录账号模拟N个用户登录,执行关注操 作。

在本步骤中,首先需要创建N个登录账号,将用户名和密码存储 至数组中,以post请求形式与社会网络服务器进行直接通信,将N个 登录账号的用户名和密码信息打包发送至社会网络服务器端,通过验 证后实现N个用户登录,上述步骤103中已经为每个登录账号分配好 关注任务,关注任务为所述社会网络事件的传播用户。

步骤105:判断是否产生验证码,若是,产生验证码的登录账号开 始休眠;否则执行步骤106。

在本步骤中,若某登录账号在登录时产生验证码,则统计该登录 账号出现验证码的次数N,并计算本次线程休眠时间,休眠结束后执 行步骤104。

步骤106:更新该登录账号完成关注任务的标志位,等待其他登录 账号的结束,当所述登录账号均完成关注任务后,执行步骤107。

步骤107:将每个登录账号得到的用户关注列表作为一个群组,依 次进入各群组中用户的共同关注页面,并将共同关注的用户信息存储 至所述群组的用户关注列表中,通过用户之间的关注信息,构建群组 内的用户关系网络。

步骤108:每个登录账号依次访问其他登录账号得到的群组中的用 户,通过用户之间的关注信息,构建本群组内的用户与其他群组的用 户关系网络。

通过步骤107和108,最终实现参与事件传播的用户之间的关系拓 扑网络。

由此本实施例的社会网络传播拓扑中用户关系构建方法,采用了 一个有效且高效的框架构建转发网络信息的用户之间的关系,设计了 一种基于共同关注的方法对未知关系的两个用户进行边连接,识别其 是否存在关注属性,同时可以采用多线程的方式并发实现关注操作, 即保证了系统的执行效率又防止了社会网络的异常用户审查机制。

本实施例的社会网络传播拓扑中用户关系构建方法,创新性地采 用基于共同关注、关注的关注、网页解析登录等方法实现对网络事件 传播中用户之间的关系进行构建,确保了用户关系网络的真实性与准 确性。

本实施例二以新浪微博为例,说明本发明的技术方案。本实施例 二的事件传播中用户关系的构建方法包括步骤与上述实施例一的具体 实施方式相同,由于新浪微博对于用户的批量关注操作具有审查机制, 并严格限制网页机器人行为,当进行单一关注操作到达一定次数后将 返回验证码,因此需要等待一段时间后再执行相关动作。

在获取转发用户列表过程中,会遇到翻页问题。当某个事件转发 量较大时,无法一次性返回全部用户信息,而是采用翻页形式,每次 翻页会得到最多20条用户信息,最终将全部获取的信息去重后融合到 一起,因此需要针对当前页号、翻页次数等现象进行判断。

通过网页解析方式实现新浪微博的登录,并新浪中若干热门微博 为种子节点,经过系统的用户关系构建方法,最终实现了将参与事件 转发的用户通过“关注、粉丝”的关系连接起来。在采用多账号多线 程同步执行关注操作的情况下,程序的时间复杂度为O(m*n),其中m 代表登录账号的个数,n代表时间传播过程中参与用户的人数。

图4示出了实施例三提供的社会网络传播拓扑中用户关系构建系 统的结构图,如图4所示,本实施例的社会网络传播拓扑中用户关系 构建系统包括种子列表获取模块401、社会网络事件的传播用户获取模 块402、关注任务分配模块403、关注模块404、共同关注获取模块405 和二级关注获取模块406;

其中,

种子列表获取模块401,用于根据某一社会网络事件,获取一个以 上所述社会网络事件的转发页面的链接作为种子列表;

社会网络事件的传播用户获取模块402,用于根据社会网络事件获 取模块发送的种子列表,通过网页解析方式获取所述社会网络事件的 传播用户;

关注任务分配模块403,用于将所述社会网络事件的传播用户作为 关注任务分为N组,将N组关注任务分配给N个登录账号;

关注模块404,用于使预设的N个登录账号模拟N个用户登录, 分别对N组关注任务执行关注操作,将每个登录账号得到的用户关注 列表作为一个群组;

共同关注获取模块405,用于依次进入各群组中用户的共同关注页 面,并将共同关注的用户信息存储至所述群组的用户关注列表中,通 过用户之间的关注信息,构建群组内的用户关系网络;

二级关注获取模块406,用于使每个登录账号依次访问其他登录账 号得到的群组中的用户,通过用户之间的关注信息,构建本群组内的 用户与其他群组的用户关系网络。

其中,所述系统还包括重复项识别模块407,用于对社会网络事件 的传播用户获取模块获取的社会网络事件的传播用户进行去重。

其中,会网络事件的传播用户获取模块中所述社会网络事件的传 播用户包括社会网络事件的原创用户和转发用户。

其中,共同关注获取模块和二级关注获取模块中的所述用户关系 网络为所述社会网络事件的传播用户之间,通过关注和粉丝两种连接 关系形成的节点网络拓扑。

本实施例所述的系统,可以用于执行图1所示方法实施例的技术 方案,其实现原理和技术效果类似,此处不再赘述。

以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管 参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员 应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使 相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号