首页> 中国专利> 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法

一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法

摘要

本发明包括三个步骤:首先,利用雪球式抽样法确定用户样本数据,并将该样本中用户之间的联系记录代入邻接矩阵,以绘制出t-1期和t期的个人逐月网络信息;然后通过使用用户个人信息和自学习效应、向他人学习效应及网络效应,建立“用户离网行为动态学习模型”,该模型包括:用户在网概率公式和用户离网概率公式,利用t-1期个人逐月网络信息数据并采用两阶段嵌套定点估计方法对模型结构参数进行估值;最后利用条件概率,将步骤二中的参数以及样本中t期的个人逐月网络信息数据,代入用户在网概率公式和用户离网概率公式,得出用户行为的预测结果。本发明首次把社交网络概念融入用户离网预测模型,采用动态模型建模,真实地模拟了用户决策行为。

著录项

  • 公开/公告号CN104598987A

    专利类型发明专利

  • 公开/公告日2015-05-06

    原文格式PDF

  • 申请/专利权人 南京华苏科技股份有限公司;

    申请/专利号CN201410779356.X

  • 发明设计人 胡漫恬;欧阳晔;程艳云;闫兴秀;

    申请日2014-12-16

  • 分类号G06Q10/04(20120101);G06Q50/00(20120101);

  • 代理机构32207 南京知识律师事务所;

  • 代理人汪旭东

  • 地址 211399 江苏省南京市高淳县淳溪镇龙井路6号

  • 入库时间 2023-12-18 08:44:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-21

    授权

    授权

  • 2018-07-20

    著录事项变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20141216

    著录事项变更

  • 2015-05-27

    实质审查的生效 IPC(主分类):G06Q10/04 申请日:20141216

    实质审查的生效

  • 2015-05-06

    公开

    公开

说明书

技术领域

本发明属于移动通讯领域,特别涉及一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法。

背景技术

随着电信行业的竞争愈演愈烈,并基本趋向于市场饱和,电信运营商的用户离网已经成为一个显著的问题。在这个行业里,每一个新用户都必须从竞争对手那里争取得来。例如,在美国无线产业中,2009年无线普及率整体达到91%,拥有285万用户。平均每月用户离网率(为在给定时间内离网的用户比例)介于1.1%到3.2%之间。由普华永道会计师事务所在2006年进行的一项调查显示:在世界各地,67%的无线运营商的用户年离网率超过了16%。由于赢得一个新用户的成本远远高于维护一个现有(Hadden等人,2007)用户的成本,对运营商来说当务之急是将重点从快速发展新用户策略转移到用户驻留管理策略。因此,对于用户更换运营商的决定,了解其背后的行为机制对于企业和学术界都变得至关重要。

为什么人们要更换无线运营商?根据ComScore网络公司在2007年进行的对于美国无线手机用户的行为和认可的全面调查,主要原因为:无线网络的覆盖问题、价格优势以及朋友或家人使用的运营商(表1)。该结果表明,正如以往文献强调的(例如,MOZER等人,2000,Gaynor等人,2005,Iyengar等人,2007),除了服务质 量和成本等因素外,家人和朋友圈的影响也很重要。社会学家断言,一个人所了解的大部分信息,是通过观察他人做出的决定从而产生的结果来获得(Bandura 1986)。因此,在一个动态社会模型里应该考虑到他人的影响这一点。

表1 更换无线运营商的原因(ComScore的调查)

来自他人的影响可以分为两种机制:社会学习和网络效应。驻留或更换运营商的决定受到几个因素的影响。首先,当前使用的运营商的服务质量将直接影响到用户驻留运营商的决定。然而作为一个服务性产品,人们在真正使用它之前通常不太确定它的好坏(比如具体到某一小区的网络覆盖情况),因此他需要通过直接的用户体验来了解它的质量。而这将被模型中的动态学习机制所捕捉。这一模型机制在之前的文献中已经被证明使用过。社会化传播通过两种机制影响人们的决定。其一,通过朋友圈的意见的反馈,用户将了解其他运营商的服务质量,进而会影响用户的选择,这一点会被模型中的社会学习机制所捕捉。其二,使用相同网络的联系人的数量将产生网络效应从而直接影响用户驻留运营商的决定。这将被模型中的网络效应部分 捕捉到。

我们提出的框架借鉴了三个研究领域:动态学习、社会学习和网络效应。由Phillip Nelson(1970)开始,体验商品或消费前不能确定品质的商品,一直是广为研究的主题(例如,Ackerberg 2002;Clay,Goettler,and Wolff 2003;Israel 2005)。当用户在信息不完全的情况下进行抉择时,各种关于产品质量的信息来源将影响用户的需求,其中包括广告(Ackerberg 2002)、专家评论(Reinstein andSnyder 2005)、定价(Erdem,Keane,and Sun 2008)和借鉴重复消费(Erdem and Keane 1996;Crawford and Shum 2002)。用户还可以可以通过观察朋友圈中他人的选择和他们的体验结果来了解产品的质量,还可以通过其他用户的体验推断出产品质量。这就是我们所说的社会学习(Ellison and Fudenberg 1993)。举例来说,当用户看到更知情的朋友更换了或者正在使用某个无线运营商,他们可能推断出该无线运营商对于他们自己也具有很高的价值。关于从自己的使用体验中学习与从他人的使用体验中学习之间的关系的理论模型已经发展成熟(McFaddenand Train 1996;Bolton and Harris 1999),但实际实施研究还比较罕见。

除了社会学习带来的间接信息的影响,在网络效应下,同龄人的选择也影响着用户的需求。网络效应是指一种外部性效应,“本地”是指直接影响用户的朋友圈作出的决定和行为的影响(即相同无线运营商的直接接触),而不是产品用户群大小的增长(即Katz and Shapiro 1985)。该效应基于同龄人的压力(“跟上攀比”),或用户节 省成本的目的来实现。例如,一些无线运营商对网内、网外通话和短信收取不同的价格,因此使用相同无线运营商(较大的网络规模)的联系人越多,产生的潜在“节省”就越多,同时,此无线运营商越具有吸引力。

这引起了所谓的“资费媒介的网络效应”(Laffont,Rey and Tirole(1998b))。它意味着,用户在做出是否更换运营商决定时包含了他们对其所有联系人所作的更换运营商的决定的预期。在这里,我们的目标不是分别识别不同的网络效应的来源,而是将它与社会学习效应进行比较,因为两者表面上会导致相同的结果。也就是说一个人更换运营商的概率会随着越来越多的联系人离开该无线运营商而增大,然而我们希望能够区分有多少可以归因于更换的不确定性(社会学习效果)的减少,有多少是因为较小的网络规模从而使当前无线运营商对用户的控制力减少。

在这个模型里面,更换无线运营商的决定是动态的。这也符合现实中这一行为的特点。移动服务,作为一种质量不确定的体验产品,用户即使更换也要权衡所要承担的所有风险,或是等待一段时间通过自己的使用体验来积累更多的信息的利弊,朋友圈的决定鼓励着他们要有前瞻性。此外,由于当地网络效应,用户面临着另一个权衡。他们可以在今天更换,但明天可能就因使用不同的无线运营商,而使与联系人的通信成本变高,或者继续留在当前的无线运营商,在观察他们的联系人的决定以后再决定。

最近一些关于用户驻留和用户离网预测的实证研究已经涉及到了的社会效应(Birke 2006,Dasgupta et al.2008;Richter et al.2010;Nitzan and Libai 2010),并用统计模型来验证假设,作出比以前更准确预测。然而,我们的模型与他们的区别在于,作为一个动态的结构化模型,它侧重于识别用户更换决定的基本行为机制。这可以让我们以后进行多次反事实分析(Chintaguanta and Erdemet al.2006)从而制定最优的公司策略。据我们所知,这是第一个在社会网络背景下集成了学习框架的工作,在这里,用户具有前瞻性并且他们的决定是内在的。

动态模型在估计上有两个主要挑战:动态平衡的计算,以及因多重均衡存在而产生的不确定性问题。事实上,平衡状态下网络规模变化,必须与实际所观察到的相一致,因此我们提出了一个算法,其在概念上类似于两阶段式估计,如Hotz and Miller(1993),Pakes,Ostrovsky,and Berry(2007)和Bajari,Benkard,和Bajari,Benkard,and Levin(2007),但在实施的细节上明显不同。我们提出的算法允许未观测状态变量的存在。我们用参数来估计第一步中的网络规模的转移概率。利用给定的估计网络规模,在第二步中,我们使用Keane和Wolpin(1997)技术的变种(Crawford和Shun 2005)来预估结构化参数。为了检验模型,我们对使用了预估参数的模拟数据的汇总统计与实际数据进行了比较,并取得了令人满意的结果。

为了说明该框架的管理和政策的影响,我们发现在给调控计划和个人信息的情况下,对用户更换运营商的决策最具影响的三个 因素是动态学习、社会学习和网络效应。我们的研究结果表明,对用户来说,当前无线运营商的平均服务质量至关重要,这与Mark Israel(AER 2005)的研究结果一致。我们的研究结果还表明,相对于社会学习,从自己的使用体验中学习速度较慢。这强调从竞争对手获取新用户的重要性。模拟结果表明,相对于社会学习,网络效应在网络弹性分解即用户驻留概率的百分比变化与网络规模的百分比变化的比值上有更大的影响。这证明了先前的研究(Israel 2005),说明更快的学习在增加用户的利益方面不如最小化锁定效用(minimizing lock-in utility)通过评估是否取消网络电话价格区别后,用户驻留率的变化,我们还提供了关于移动终接费率政策mobile termination rates policy的见解,这是一个在欧洲颇有争议的监管话题。不考虑社会网络环境的模型,即没有社会学习,没有直接网络效应,往往低估了政策的影响。

发明内容

本发明提供了一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,主要包括以下内容:

步骤一样本数据采集:所采集的数据包括用户个人信息和用户网络信息;利用雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内,以月为单位的时间段,该时间分为两段:t-1期和t期分别都以为月为单位,将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息 逐月进行采集,同时针对种子及至前n-1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。

步骤二建立用户离网行为动态学习模型与参数估计:本模型以用户离网行为的动态理论分析为基础,除了使用用户个人信息,还着重模拟了向自己学习效应、向别人学习效应以及网络效应四个因素对用户离网行为的影响。模型建立后将样本中t-1期的用户个人逐月信息及其网络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方法对用户离网行为动态学习模型的结构参数进行估值。

步骤三利用条件概率理论:将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。

本发明具有以下优点:

1)首次把社交网络概念融入用户离网预测模型,其涉及了他人学习、网络效应两个因素;

2)采用动态模型建模,更加贴切现实世界的用户决策行为;

3)采用两阶段嵌套定点估计方法对该模型的结构参数进行估值,解决了高微积分计算量大的难题。

附图说明

图1本发明的预测流程示意图。

具体实施方式

下面结合附图对本发明做进一步说明。

如图1所示,本发明主要包括三大步骤具体介绍如下:

步骤一:样本数据采集

数据采样

本专利数据采集采用雪球抽样,雪球抽样用于生成数据。数据提供者从整个移动网络中随机选取20个人并将它们命名为“种子”。基于这些种子,数据提供者找到他们在采样周期开始的短时间内通过电话或者短信所联系的人。该运营商认为那些直接联系的人是种子的邻居或“朋友”。同时,他们形成了一个球形的网络群体。之后,运营商从每一个“邻居”出发,继续收集直接联系人邻居的邻居的信息,拓展网络至直接连接到该“邻居”的个人,并停止滚动。因此,对抽样中的每个人,我们都有一个完整的网络和人口统计信息。

这里所采集的数据包括用户个人信息和用户网络信息;方法是利用上述的雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内(以月为单位的时间段,该时间分为两段:t-1期和t期分别都以为月为单位),将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息逐月进行采集,同时针对种子及至前n-1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。

步骤二:建立用户离网行为动态学习模型与参数估计

离网行为模型建立

该模型由四个子模型组成,网络质量信息模型、自学习模

型、他人学习模型、网络效应模型。所以下面分四个方面分别建模,

最后把四个子模型统一成离网行为模型。

1)网络质量信息模型

在时间周期t内,假设当前用户的单个周期u1t是sct和zt(Xt,Nett)效用函数,其中sct是在时间t接收到的当前网络的质量属性。正如Crawford和Shum(2005)主张的,在离散选择需求的文献中,使用的线性效用方法受到很大的限制,特别是在被排除不确定影响的情况下嵌入在方法中的中立风险。继他们之后,我们考虑一个拟线性效用方法,对于子效应函数sct以及zt线性成分,该方法可以稳定地规避风险。

u1t(zt,Sct;θ)=-exp(-rSct)+θXt+λNett,                   (1.1) 

其中r表示风险规避程度,λ捕捉当地网络效应。

本文中,我们假设θXt是详细计划和用户特征的线性效用方法:

θXt=θ1Price+θ2Min+θ3Fam+θAAge+θ5Male,            (1.2) 

其中Price是对每个人当前计划的在网/离网通话费用,它是起初设定好的并不随时间改变;Min是该计划包含的时间,单位为分钟;Fam是虚拟的家庭计划。

定义u0t(Sot)为其他无线运营商抽象的效用函数:

u0t(Sot;θ)=-exp(-rSot),            (1.3) 

其中sot是接收到的其他无线运营商的质量属性。

我们假设选择操作之前,每个用户接收一个专用选择偏好影响εit(dit),这只有用户自己知道而没有被研究人员观测到。由假设可知,它是独立于代理商之外的。

假设,如果当前网络效用值+更换折算值+更换特殊体验值〉当前网络效用值+驻留折算值+驻留特殊体验值,用户就会选择更换运营商。

因此,贝尔曼(Bellman)方程给出了,每个周期开始时在网用户的数值(Pakes,Ostrovsky和Berry 2004年;Dunne,Klimek,Roberts和Xu 2009年):

V(It;θ)=max{u1t(zt,Sct;θ)+βVC(It;θ)+εt(1),u1t(zt,sct;θ)+βVX(It;θ)+εt(0)}.(2)

VC(.)是驻留数值,是对下一个周期期望的效用函数:

VX(.)是更换数值,是其他无线运营商预期的效用函数:

2)自学习模型

虽然不能确定体验商品的质量,用户被假定为有起初的相关信息。每个用户对产品实际质量的起初认知Qic,可以用正态分布描述:

Qic~N(μc,σμc2).---(3.1)

在这个表达式中,μc表示起初平均质量,标准差σμc描述了起初方法的准确性。用户i不知道Qic但接受质量属性,这使他能够更 新他对产品实际质量的认知。我们假设信号是独立的,且在围绕实际服务质量(Qic)的周期上服从正太分布:

Sict~N(Qic,σc2).---(3.2)

Sict是由用户观测到的,但研究人员不知道;而Qic对两者都是未知的。使用经验及随后的观测信号Sict并不完全显露,但Qic确实提供了有关它的信息。这种带有起初Qic共轭的分布的假设,形成了一个用户关于Qic后验观念的贝叶斯学习过程,可以通过递归的方法由质量平均值为πict,方差为Vict的正态分布序列(DeGroot 1970年)给出:

πict+1=πictVict+Sict+1σc21Vict+1σc2=σc2Vict+σc2πict+VictVict+σc2Sict+1ifdit=1πictotherwise---(3.3)

Vict+1=11σμc2+nit+1σc2ifdit=1Victotherwise,---(3.4)

其中nit+1代表直到周期t+1,用户i驻留当前运营商不变的周期数。

我们假定用户具有理性预期,使他们的起初体验等于感知的“真实”质量Qic在用户上的准确分布。因此,μc是当前移动网络运营商服务质量的总体平均值,σμc是它的异质性或分散系数。μc,σμc和 的值就是将要估计的。

3)他人学习模型

向别人学习的过程与从自己的经验中学习是非常相似的,Qic表示用户i对其他无线运营商实际质量的感知,除了两个方面。首先是识别的原因,我们正常化其他无线运营商的起初平均值为零,并假设初始方差的等式:

Qio~N(0,σμo2)---(4.1)

σμc2=σμo2.

第二,只有当用户同网络的一些邻居更换了网络时学习过程才会发生,所以可能在许多周期内都没有学习过程,也可能在同一周期发生很多次学习过程。

例如,在周期t中,假定有两个离网的联系人1和2,联系人1在联系人2之前离网。质量属性仍然假设为服从正态分布得出:

Siot~N(Qio,σo2).---(4.2)

联系人1离网后,

πiot+1=πiotViot+Siot+1σo21Viot+1σo2=σo2Viot+σo2πiot+ViotViot+σo2Siot+1πiot---(4.3)Vict+1=11σμo2+mit+1σo2Viot.---(4.4)

联系人2离网后,

πiot+1=πiot+1Viot+1+Siot+1σo21Viot+1+1σo2=σo2Viot+1+σo2πiot+1+Viot+1Viot+1+σo2Siot+1πiot---(4.5)

Vict+1=11σμo2+mit+2σo2Viot+1,---(4.6)

其中mit为用户的联系人中在时间周期t+1之前离网的人的数量。一个理性的预期假设也是由此提出的。需要注意的是,其他无线运营商的起初均值等于0时,在上一节中所定义的μc实际上表示当前无线运营商的相对质量,而不是绝对的。

4)网络效应模型

Netit代表在每个周期开始时用户i的网络规模,NSWit是在 时间t离网的联系人数量(这在用户做出决定时是未知的)。要计算公式(2.1)中的VC(.),我们需要构造,在当前状态变量下用户对离网联系人数量的感知。这些感知生成了概率分布P(NSWit|Netit,Xit)。为了平衡,P(NSWit|Netit,Xit)应当与联系人的行为一致,换句话说,用户有理性预期。

Netite=Netit-NSWite=Netit-NSWitdp(NSWit|Netit,Xit),---(5)

其中和表示当前状态的期望条件。

在网、离网模型:

在网的用户i的选择方法函数是:

离网的用户i的选择方法函数是:

我们假设选择特定的偏好影响εit(dit)符合极值分布。那么,利用条件概率理论(CCP)可以通过一个简洁的表达式说明。

Prob(dit=1|It)=exp(V1(It))exp(V1(It))+exp(V0(It))---(6.3)

Prob(dit=0|It)=exp(V0(It))exp(V1(It))+exp(V0(It)).---(6.4)

最终函数是: 

V(It)=∫max{V1(It),V0(It)}dP(εit)=log(exp(V1(It))+exp(V0(It)).   (6.5) 

模型建立后将样本中t-1期的用户个人逐月信息及其网 络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方式对用户离网行为动态学习模型的结构参数进行估值。模型参数估计具体介绍如下:

模型参数估计

该模型采用两阶段嵌套定点估计方式对动态模型的结构参数进行估值,估计包括两个步骤。

第一步,我们想要估计每一个人的说明了网络规模在数据上已经验证的转移概率。我们注意到,对于每个周期,离网邻居的最大数目是2。因此,我们假设可以通过Netit和Xit的多项式 逻辑模型来近似。因为用户的期望必须与平均实现一致,这些估计将收敛到离网邻居的实际预期数:

Prob(NSWite=j)=exp(γj1Netit+γj2Xit)1+Σj=12(γj1Netit+γi2Xit),j=1,2,---(7.1)

Prob(NSWite=0)=11+Σj=12(γj1Netit+γj2Xit).---(7.2)

第二步把的估计值作为已知数,并通过从周期开始时的网络规模减去这个数计算出网络规模。然后,我们用Keane和Wolpin(1994)近似法(Crawford和Shum2005年)来估计结构参数。它本质上是一个嵌套定点估计。

在方程(6.1)和(6.2)中,由于Sict和Siot较大,期望难以计算。因此,我们使用模拟来逼近期望。模拟的可能性为,

Πi=1I(1sΣs=1SΠt(exp(V1s)exp(V1s)+exp(V0s))dit(exp(V0s)exp(V1s)+exp(V0s))(1-dit)).---(8)

在我们这个环境下直接执行BBL(2007年)是不可行的,所以,服务质量是不可观测的。因此,我们的方法是,在一个嵌套定 点估值算法下使用两步模型。我们承认在第一步中使用的假设是受限制的。然而,之后的仿真结果证明了这些假设的有效性。它展示了使用从数据中获得的信息来建立经验模型的重要性。

步骤三:利用条件概率理论,将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。

虽然本发明已以较佳实施例公开如上,但实施例和附图并不是用来限定本发明,任何熟悉此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,但同样在本发明的保护范围之内。因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号