首页> 中国专利> 利用社会网络上最有影响力节点实现高效病毒营销的方法

利用社会网络上最有影响力节点实现高效病毒营销的方法

摘要

本发明公开了一种利用社会网络上最有影响力节点实现高效病毒营销的方法,依次包括以下用户定义及资源定义、用户与资源之间的关系建立连边、两个用户之间的兴趣强度建立、定义界观尺度的带权网节点重要性度量指标、计算在带权网络下NN集合中边权的和、建立营销模型等步骤。本发明利用真实的社会网络中用户-资源间的关注记录,挖掘用户兴趣并构造用户兴趣强度关系图,利用用户共同关注在此基础上采用基于邻域信息的半局部中心性的方法确定有影响力节点,以这些节点作为初始节点在用户兴趣网上进行营销信息传播,在传播模型中引入了能够较好还原现实生活中人际交互过程的关键要素:累计效应、社会加强效应和朋友关系强度,具有计算量小、鲁棒性强的特点。

著录项

  • 公开/公告号CN103279512A

    专利类型发明专利

  • 公开/公告日2013-09-04

    原文格式PDF

  • 申请/专利权人 湖州师范学院;

    申请/专利号CN201310186551.7

  • 发明设计人 蒋云良;苏晓萍;申情;宋玉蓉;

    申请日2013-05-17

  • 分类号G06F17/30(20060101);

  • 代理机构11340 北京天奇智新知识产权代理有限公司;

  • 代理人韩洪

  • 地址 313000 浙江省湖州市吴兴区学士路1号

  • 入库时间 2024-02-19 20:08:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-29

    授权

    授权

  • 2013-10-09

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20130517

    实质审查的生效

  • 2013-09-04

    公开

    公开

说明书

【技术领域】

本发明涉及网络营销方法,尤其是利用社会网络上最有影响力节点实现高 效病毒营销的方法。

【背景技术】

随着Web2.0技术的发展,新一代社会网络快速出现,由于社会网络已经成 为一种新的社交手段,且社交网络上的信息传递比传统社会交往更为快捷、迅 速,因此,病毒营销通常以社交网络为基础。病毒营销区别于传统的营销模式, 其核心理念是通过用户间的“口口相传(world-of-mouth)”进行商品的推广, 因为人们通常会认为来自朋友或其他信任源的推荐比商家的推荐可靠。病毒营 销策略一般针对能够触发品牌知名度的少数用户,当这些用户信任并购买了商 品后,在所有网络成员间可以通过自我复制的病毒扩散方式进行消息传递,实 践证明这种利用社会关系促进商品销售是有效的营销策略:Hotmail通过病毒营 销半年内就吸引了1200万注册用户,但是其营销费用却不到其竞争者的3%,目 前许多电子商务企业也尝试使用病毒营销,如在电子商务网站Amazon、淘宝、 当当上,人们愿意选择那些被其他用户打了高分或评价高的物品,这说明用户 的购买决策会受到周围人态度的影响。事实上这一过程就是用户将“喜欢某物 品”的信息传递给他的朋友的过程,“口口相传”的推荐对塑造其他用户的购买 行为起着重要的作用。

病毒营销成功的关键是准确寻找网络中有影响力的节点,通过他们向其邻 居的推荐可以使商品信息快速在网络中传播,从而保证病毒营销能够在较少投 入情况下获得较大收益。

以往的研究经常以度作为衡量节点影响力的重要依据,尽管采用度衡量节 点影响力不需要获得网络的全局信息,实现简单,但在很多情形会失效;而介 数(betweeness)、接近中心性(Closeness Cencentrality)则是全局概念,需要 获得网络全部信息,计算量大,不适合在大型社会网络上影响力节点的寻找。

计算机科学领域将病毒营销问题定义为影响力最大化问题:给定一个社会 网络,确定节点的最小集合使传播最大化。经典的算法有:Kempe:指出影响 力最大化问题是一个NP完全问题。以上算法采用独立级联模型(Independent  Cascade Model,简称IC)和线性阈值模型(Linear threshold model,简称LT), 以下简称LT模型)作为传播模型,利用贪心算法寻找网络中最小网络节点集, 使传播最大化,以上模型并不考虑信息传播的累计效应和社会加强效应以及传 播速度,且算法通常复杂度较高,无法应用于大规模社会网络。

复杂网络与统计物理学领域则通过社交网络的拓扑结构分析,尝试通过网 络中个体和群体行为特征来寻找网络中有影响力的节点。目前衡量节点重要性 的指标有:节点的度、介数(betweeness)、接近中心性、K-Shell等。从网络微 观结构看,具有更多连接的节点即度大节点,在传播中有更多机会传播信息, 是网络中重要节点,度大的节点也被称为hubs节点,但是用度衡量节点的重要 性在一些情况下会失效:无标度网络上的疾病传播中,单个传播源、低感染率 情形,通过K-shell分解确定的网络核心节点是最有影响力的节点,即K-Shell 值的大小才是更好地反映传播能力的指标,度大的节点K-Shell值有时却很小; 然而在多个传播源的情况下,hubs节点依然比K-shell值大的节点具有更高的传 播效率;也有研究表明:通过K-shell分解确定的网络核心节点是对网络传播特 征的粗粒度描述,不能精确描述具有不同传播特征的节点特性,具有不同网络 结构所找到的最大K-Shell值的节点数目差异也较大;另外,介数(betweeness)、 接近中心性、K-Shell是从网络宏观结构出发,寻找网络重要节点。这些参数的 计算需要获得网络的全局信息,计算复杂度高,不适合应用于大规模在线社会 网络。

以上研究均针对病毒与信息的传播,且基于无权网络。病毒营销与社交网络 上的信息传播问题具有相似之处:两者都具有累计和社会加强效应:一个信息 一个人说过也许个体不会相信,可是当越来越多的人都在传播该信息时,个体 相信该信息的概率将会累计增加(病毒传播并不具备这一特点,每次感染过程 是相互独立的);另外,病毒营销和信息传播都关心“信息”在社交网络上的传 播过程和传播范围,但二者研究的内容和研究视角有所不同:社交网络上的信 息传播采用类似于传染病动力学中SIR、SI模型及其变种、考虑单个传播源在 网络中的传播范围、传播随时间的演化,关心传播达到稳态时感染个体数目即 病毒传播的范围和传播阈值:病毒爆发的条件。而病毒营销则是初始时,在网 络中投放若干感染节点(商品推销者),目标是使感染节点的数目在最短时间内 达到最大,病毒营销更关注传播速度。因此,借助信息传播模型进行病毒营销 的研究忽视了个体行为在信息传播和病毒营销中的区别,不能真实反映病毒营 销的特征,同时,根据强弱关系理论,节点之间的关系有强弱之分,强关系较弱 关系更有利于信息在节点之间传播,现实世界中的关系通常表现为带权网络: 朋友有亲疏之分,当一个信息来自于亲密的朋友,接受和认可该信息的概率大, 反之则小;而无权网络无法准确描述病毒营销中节点关系的亲疏。

【发明内容】

本发明的目的就是解决现有技术中的问题,提出一种利用社会网络上最有 影响力节点实现高效病毒营销的方法,能够根据真实网络数据挖掘用户兴趣, 构造用户兴趣强度关系图,在此基础上采用基于邻域信息的半局部中心性的方 法发现网络中有影响力的节点,在准确性和运算速度之间取得更好的平衡,使 该方法能够应用于大数据集。

为实现上述目的,本发明提出了一种利用社会网络上最有影响力节点实现 高效病毒营销的方法,依次包括以下步骤:

a)将社会网络中存在的用户定义为U,U={u1,u2,...um}为用户集合,资源定义 为R,R={r1,r2,...rn}为资源集合;

b)用户与资源之间的关系建立连边,所述用户与资源之间的连边表示为: G1=<V1,E1>,其中,V1=U×R,E1={<u,r>|(u,r)∈A},

c)两个用户之间的兴趣强度表示为:用户ui和uj之间的连 边权重构造节点G2=<V2,E2,w>,其中,V2={U};E2={<ui,uj>|u∈V2};

d)定义界观尺度的带权网节点重要性度量指标:其 中,Γ(u)为节点u邻居的集合,N(m)为m的邻居,集合NN为u的邻居以 及邻居的邻居的集合,当两个节点互为邻居时仅计算一次;

e)计算在带权网络下NN集合中边权的和为:

f)建立营销模型,将营销模型中的节点分为“不知道者”、“倾听者”和“传 播者”三种状态;初始时刻,初始投入n个NN_weight值较大的节点为“传 播者”,其余的节点均为“不知道者”;状态为“传播者”的节点仅向邻 居节点传播一次信息,“传播者”的所有邻居节点按照概率一部分变为“传 播者”状态,另一部分变为“倾听者”状态,所述“传播者”的邻居节 点变为“传播者”状态的概率与该个体接收到信息的次数和该个体与传 播节点之间的相似性有关;变为“传播者”状态的节点再向邻居节点传 播一次信息,如此反复传播,进行病毒营销。

作为优选,所述f)步骤中“传播者”的邻居节点变为“传播者”状态的概 率与该个体接收到信息的次数和该个体与传播节点之间的相似性的关系为:接 收信息的次数越多,该个体转变为的“传播者”的概率就越大;发送信息的邻 居节点与个体相似性越高的,该个体转变为的“传播者”的概率就越大。

作为优选,所述f)步骤中概率为:其中,p(0)=0,其 中,m为截止到t时刻个体接收到信息的次数;wi,j为第m次传播信息节点与接收 信息节点之间的边权,即:表示两个节点之间的兴趣强度;s为朋友间的参与信 息传播的热情和/或信任程度。

本发明的有益效果:本发明利用真实的社会网络中用户-资源间的关注记 录,挖掘用户兴趣并构造用户兴趣强度关系图,利用用户共同关注在此基础上 采用基于邻域信息的半局部中心性的方法确定有影响力节点,以这些节点作为 初始节点在用户兴趣网上进行营销信息传播,在传播模型中引入了能够较好还 原现实生活中人际交互过程的关键要素:累计效应、社会加强效应和朋友关系 强度。该方法与具有以下优点:(1)与用微观尺度—节点的度来衡量节点的传播 影响力相比,用界观尺度—节点的邻居和邻居的邻居衡量节点传播影响力的方 法能更准确地发现社会网络上有影响力节点,以这些节点作为初始节点能够使 商品信息在用户关系网中更快速地传播;(2)信息传播范围与网络中节点间联系 的紧密程度相关,关系紧密的网络信息传播快且范围广,相反,稀疏的网络不 利于信息传播;(3)网络越稀疏启动人群购买愿望需要投入的初始节点数目越 多。该方法在准确性和运算速度之间取得更好的平衡,具有计算量小、鲁棒性 强的特点,适用于大规模社会网络的研究。

本发明的特征及优点将通过实施例结合附图进行详细说明。

【附图说明】

图1-1是本发明中用户兴趣强度关系图的构建中用户-资源二部图;

图1-2是本发明中用户兴趣强度关系图的构建中基于兴趣强度的用户关系 图;

图2是本发明中一个邻居的邻居影响力的举例示意图;

图3是本发明中不同节点密度随时间的变化关系图;

图4是本发明中两种寻找最有影响力节点方法对病毒营销效果的影响示意 图;

图5是本发明中社会加强因子对病毒营销效果的影响示意图。

【具体实施方式】

1.网络模型

一般的,社会网络中存在用户(Users)、资源(Resources)两类对象, U={u1,u2,...um}为用户集合,R={r1,r2,...rn}为资源集合,当用户对资源有兴趣则在 该用户与资源间建立一条边,因此,用户与资源间的关系可以表示为一个二部 图如图1-1所示:G1=<V,E>,其中,V=U×R,E={<u,r>|(u,r)∈A}, A{<u,r>:uU,rR}.

两用户间兴趣强度可被定义为:

w(i,j)=|RiIRj||RiURj|---(1)

从式(1)可以看出,两用户间共同感兴趣的资源越多,w(i,j)的值越大,以 w(i,j)为用户ui和uj间连边权重构造节点仅为用户的带权一部图如图1-2所示: G2=<V,E,W>,V={U}。图1-2根据用户对资源兴趣引入节点的兴趣连边权重, 能够准确描述用户节点间的强弱关系:两用户兴趣越相似,连边权重越大。以 上基于二部图投影的方法合理地构建了研究病毒营销所需的带权网络模型。

2.确定病毒营销中有影响力的节点

病毒营销的核心问题是确定网络中最具影响力的节点,对广告投放精确定 位,从而确保在最少的投入下,产品相关信息能够得到最广泛的传播。度是微 观尺度下衡量节点重要性的关键指标,但是在无标度网络中,度并不能准确衡 量节点的影响力,因为度仅反映网络的局部特征,而介数、K-Shell等指标需要 获得网络全局信息计算量巨大并不适合应用于大规模的社会网络,因此,就需 要构造衡量网络中节点重要程度的新指标。基于对现实世界的一个普遍认知: 朋友的朋友很有可能也具有相似的兴趣与爱好,而我们也更信任志趣相投的人, 他们的行为对我们具有更强的影响,如图2所示(这里假设每条边的权重相等), 尽管1号节点拥有最大的度,但是由于它的邻居节点很少有邻居,因此它在网 络中的传播影响力并不是最大,而10号节点尽管度比较小,然而它拥有11、12、 16号邻居而它们的度较大,因此10号节点在该网络中拥有最大影响力。

根据以上思路,利用节点的邻域信息定义界观尺度的带权网节点重要性度 量指标:

NN=Γ(u)UmΓ(u)[N(m)-u]---(2)

NN_weight=Σi,jNN,<i,j>Vwi,j---(3)

式(2)中,Γ(u)为节点u邻居的集合,N(m)为m的邻居,因此,集合NN为u的 邻居以及邻居的邻居的集合,当两节点互为邻居时仅计算一次

式(3)则是在带权网络下NN集合中边权的和,在图2中,设边的权重为1 时,根据式(3)计算可得1号节点的NN_weight值为8,而10号节点的NN_weightNN 值为18。NN_weight值定义节点影响力排名,NN_weight越大表示节点与其邻居 以及邻居的邻居间具有更大的相似性,这样的节点具有更强号召力,来自于它 的推荐信息更容易被相信。

3.传播模型

在病毒营销的过程中,将商品信息投放给若干影响力较大节点,通过它们的 口口相传使其他节点了解并使用商品,因此,病毒营销关心以下问题:(1)信息 在怎样的情形下能够在网络中转播以及传播的范围有多大;(2)信息怎样以最快 速度在网络中有效传播。

根据病毒营销的特点建立传播模型。首先给出模型中节点在某一时刻的状 态:

1.不知道(unknown)—不知道相应信息的个体,类似于SIR模型中的易感 人群。

2.传播者(spreader)—知道信息并有购买意愿的个体,具有向其邻居传播 信息的能力。

3.倾听者(know)—知道信息,但还没有购买意愿的个体,它们仅接收信息 却不传播信息。

初始时刻(t=0),初始投入n个NN_weight值较大的节点为spreader状态, 其余节点的状态都为unknown。spreader节点仅向邻居传播一次信息,即传播 链路仅被使用一次(这符合现实生活中信息交流的特点:一个消息只向认识的人 说一次)。其邻居节点的状态将按一定概率变为spreader状态,剩余邻居变为 know状态。对于某一个状态为unknown或know的个体,接收到来自邻居的信息, 其状态转变为spreader的概率由以下因素:该个体在t时刻之前接收到信息的 次数和它与传播节点之间的相似性。接收信息的次数越多,其转变为spreader 的概率就越大;来自相似性高的朋友间的信息将使其具有更大概率变为 spreader。根据病毒营销的特点,给出合理的传播模型:假设节点在时间t知道 并使用商品的概率为:

p(m)=1-e-[s*wi,j+p(m-1)]其中,p(0)=0    (4)

其中,m为截止到t时刻,个体接收到信息的次数,m体现了信息传播的记 忆性特征。wi,j为第m次传播信息节点与接收信息节点间的边权。公式(4)能够很 好地描述累计效应:概率p随接收信息次数的增加而增加;社会加强效应:wi,j、 s越大概率p越大,wi,j表示两节点间兴趣的相似强度,s表示朋友间的参与信息 传播的热情或信任程度:人们更愿意相信与自己兴趣爱好相近的朋友的推荐, 朋友间对该信息的信任程度越高,个体越容易相信。本模型对还原现实病毒营 销特点具有一定的解析力。

4.仿真与实验结果

4.1数据集

选择3个典型数据集验证所提模型的有效性,它们分别是:国际会议HetRec 2011提供的用于研究推荐系统异质性和数据融合的数据集:MovieLens、 Delicious、Last.fm。根据数据集中用户对资源的观看(标注)信息,利用前面 给出的方法建立用户兴趣关系图,为消除噪声,去除了仅购买(标注)1次资源的 用户。3个数据集特征见表1:

表1:数据集特征

3个网络的度分布均满足幂律分布特征,同时发现MovieLens具有比其他两 个网络大的平均度和小的平均路径长,因此该数据集较其余两个数据集更稠密。

4.2仿真结果与分析

为验证所提基于网络局部信息而非全局信息发现网络中有影响力的节点方 法的有效性,在4.1节所介绍的数据集上发现网络中有影响力的节点,并按前 述的传播模型实现病毒营销的信息传递。

限于篇幅,只给出数据集MovieLens上详细的传播特性分析,其他各数据集 上的传播特性统计见表2。

图3是在社会加强因子s取1时unknown、spreader、know人群变化趋势, 初始时取top-10NN_weight值最大的节点状态为spreader,其余为unknow。

从图3可以看到:商品信息在初始阶段传播比较慢,在时步4后有一个加速 传播的过程,而unknown态个体很快减少,spreader态个体在快速增加后达到 稳态,此时spreader态节点密度为72.88%,说明NN_weight值较大的节点具有 较大影响力,使商品信息很快在网络中传播开来,且有相当一部分人将选择购 买商品。然而,由于人们之间的并非完全信任,也有可能对其他品牌相关商品 具有一定忠诚度,因此一部分人听到了商品信息但是却没有购买的意愿(对应 know态个体)。

分别将Top-10NN_weight和Top-10Hubs节点作为初始节点分别在数据集 MovieLens进行传播演化,统计了spreader态节点演化规律,如图4所示,采 用基于邻域信息的半局部中心性的方法确定的最具影响力节点作为初始传播源 时,可加快信息传播,在第4个时步就出现了传播加速,比起仅以Hubs确定的 最具影响力节点作为初始传播源快了2个时步。因此,以节点的邻居及其邻居 的邻居的权重之和作为衡量最具影响力节点的指标更合理。

我们还观察了社会加强因子s对传播的影响,图5给出相同数据集 (MovieLens)和初始节点的情况下,s取值不同时spreader态节点的演化曲线。 从图中可以看出:社会加强因子越大,spreader态节点稳态时的密度越大,说 明朋友间参与该信息的热情越高、且信任度越高,信息传播就越广泛,这一结 论完全符合信息传播的特征。

表2给出了取社会加强因子s=1时,3个数据集初始节点选择比例和达到稳 态时3种状态节点的密度,对照表1数据集特性看,社会网络的稀疏性将限制 信息的传播,数据集Delicious比其他2个数据集更稀疏、网络直径更大,因 此最终仅有35.6%的节点成为spreader态,即对商品有了较强烈的购买意愿, 而仍然有19.7%的节点对商品信息一无所知。罗家德等学者也曾经指出:关系紧 密的社会网络中,信息流通会比较容易,成员间合作行为比较多;相反,成员 间关系疏远通常会出现信息不畅协作程度低等问题。这与我们得到的结论相互 印证。

表2:数据集传播特性统计

实验中,初始节点数目选择的原则是使网络中节点具有从unknown、know 态转换为spreader态的能力,即病毒营销达到使一部分人对商品具有购买愿望 的目的,这一点与病毒传播有所不同,病毒在每个时步会持续以固定概率感染 邻居节点,因此病毒传播不因初始感染节点的数目而影响稳态时个体感染密度, 而病毒营销中,一个节点只向其邻居传播一次信息,而其邻居有可能选择相信 并使用产品,也有可能选择观望,直到有更多的其他邻居多次向其传播信息后 才有可能改变自身状态,这是病毒营销的特征所决定的,因此,初始投放的感 染节点数目必须保证能够触发产品信息在网络中的传播,也可以认为是信息传 播的数目阈值。实验结果表明:当初始节点数目小于表2中的选择比例时,将 出现由于累计效应和社会加强效应不足以促使节点变为spreader态的情形,网 络演化的最终结果是所有的节点均为know态和unknown态,没有出现spreader 态(除初始节点)节点;另外,从实验还可以看出:网络越稀疏启动人群购买意 愿(使节点成为spreader态)需要投入的初始节点数越多,社会关系的紧密程度 直接影响信息的传播。实际上,社区(网络聚簇)对信息传播也将产生影响,从 图2我们可以看到,之所以10号节点具有更大影响力是因为它拥有11、12、16 号邻居,而11、12、16号节点的邻居又紧密地连接成为簇,因此有理由相信, 社区的存在对传播有影响。

病毒营销成功的关键是准确寻找网络中有影响力的节点,我们利用真实的 社会网络中用户-资源间的关注记录,挖掘用户兴趣并构造用户兴趣强度关系 图,利用用户共同关注(购买)在此基础上采用基于邻域信息的半局部中心性的 方法确定有影响力节点,以这些节点作为初始节点在用户兴趣网上进行营销信 息传播,在传播模型中引入了能够较好还原现实生活中人际交互过程的关键要 素:累计效应、社会加强效应和朋友关系强度。通过在3个真实数据集上的仿 真分析得到以下结论:(1)与用微观尺度—节点的度来衡量节点的传播影响 力相比,用界观尺度—节点的邻居和邻居的邻居衡量节点传播影响力的方法 能更准确地发现社会网络上有影响力节点,以这些节点作为初始节点能够使商 品信息在用户关系网中更快速地传播;(2)信息传播范围与网络中节点间联系 的紧密程度相关,关系紧密的网络信息传播快且范围广,相反,稀疏的网络不 利于信息传播;(3)网络越稀疏启动人群购买愿望需要投入的初始节点数目越 多。

当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情 况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但 这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号