首页> 中国专利> 因果性影响的确定方法、装置、设备及存储介质

因果性影响的确定方法、装置、设备及存储介质

摘要

本申请公开了一种因果性影响的确定方法、装置、设备及存储介质,属于计算机和互联网技术领域。所述方法包括:从应用程序中登录的至少一个用户帐号对应的用户信息中,获取第一用户外在特征对应的至少一组用户信息;基于至少一组用户信息所包括的用户内在属性,确定每类用户内在属性的出现概率;基于至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望;以每类用户内在属性的出现概率为权重,对每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,得到第一因果效应估计量。本申请实施例提升了用户活跃度相关分析的准确性,有助于有效提升用户活跃度。

著录项

  • 公开/公告号CN112926638A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 百果园技术(新加坡)有限公司;

    申请/专利号CN202110190524.1

  • 发明设计人 陈坤龙;

    申请日2021-02-18

  • 分类号G06K9/62(20060101);H04N21/2187(20110101);H04L29/08(20060101);

  • 代理机构11138 北京三高永信知识产权代理有限责任公司;

  • 代理人邢少真

  • 地址 巴西班让路枫树商业城30号楼15层31A

  • 入库时间 2023-06-19 11:19:16

说明书

技术领域

本申请实施例涉及计算机和互联网技术领域,特别涉及一种因果性影响的确定方法、装置、设备及存储介质。

背景技术

观看直播和/或短视频已经成为人们日常生活中常见的娱乐休闲方式,各种直播和/或短视频应用程序也层出不穷。对于直播和/或短视频应用程序的开发者和运营者而言,用户活跃度是非常重要的分析指标。

用户活跃度是指用户在直播和/或短视频应用程序中的活跃程度。影响用户活跃度的因素多种多样,如用户所使用的终端类型、搭载直播和/或短视频应用程序的操作系统、用户的年龄、用户的职业等。而在这些影响因素中,用户所使用的终端类型、搭载直播和/或短视频应用程序的操作系统等较为容易收集的影响因素,是直播和/或短视频应用程序的开发者和运营者在分析用户活跃度的过程中尤为关注的影响因素,在此,我们称这些较为容易收集的影响因素为用户外在特征。相关技术中,针对用户活跃度的分析方法主要包括:通过估计用户外在特征与用户活跃度之间的相关性,来估计用户外在特征对用户活跃度的影响。例如,若所搭载的操作系统A对应的用户活跃度比所搭载的操作系统B对应的用户活跃度高,则可以分析认为操作系统A的用户体验优于操作系统B的用户体验。

然而,存在一种可能性,即用户的年龄、用户的职业等用户内在属性,不仅影响到用户外在特征,还影响用户活跃度,因此,根据贝叶斯网络,在用户内在属性存在的情况下,用户外在特征可能与用户活跃度之间存在相关性而并不一定存在因果性。从而,相关技术仅依据用户外在特征与用户活跃度之间的相关性来估计用户外在特征对用户活跃度的影响,是不够准确的。

发明内容

本申请实施例提供了一种因果性影响的确定方法、装置、设备及存储介质,可用于提升了用户活跃度相关分析的准确性。所述技术方案如下:

一方面,本申请实施例提供了一种因果性影响的确定方法,所述方法包括:

从应用程序中登录的至少一个用户帐号对应的用户信息中,获取第一用户外在特征对应的至少一组用户信息,每组用户信息包括一个用户帐号对应的用户内在属性、用户外在特征以及用户活跃度;

基于所述至少一组用户信息所包括的用户内在属性,确定每类用户内在属性的出现概率;

基于所述至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望;

以所述每类用户内在属性的出现概率为权重,对所述每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,得到第一因果效应估计量,所述第一因果效应估计量用于指示所述第一用户外在特征对所述用户活跃度的因果性影响。

另一方面,本申请实施例提供了一种因果性影响的确定装置,所述装置包括:

信息获取模块,用于从应用程序中登录的至少一个用户帐号对应的用户信息中,获取第一用户外在特征对应的至少一组用户信息,每组用户信息包括一个用户帐号对应的用户内在属性、用户外在特征以及用户活跃度;

概率确定模块,用于基于所述至少一组用户信息所包括的用户内在属性,确定每类用户内在属性的出现概率;

期望确定模块,用于基于所述至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望;

估计量计算模块,用于以所述每类用户内在属性的出现概率为权重,对所述每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,得到第一因果效应估计量,所述第一因果效应估计量用于指示所述第一用户外在特征对所述用户活跃度的因果性影响。

再一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述因果性影响的确定方法。

又一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述因果性影响的确定方法。

还一方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得计算机设备执行如上述因果性影响的确定方法。

本申请实施例提供的技术方案可以带来如下有益效果:

通过在估计用户外在特征对用户活跃度的影响时,考虑到用户内在属性在用户外在特征和用户活跃度之间引入的相关性,并将用户内在属性边缘化,从而估计出用户外在特征对用户活跃度的因果性影响,避免将用户外在特征与用户活跃度之间的相关性错误判断为用户外在特征对用户活跃度的影响,提升了用户活跃度相关分析的准确性,有助于后续根据分析结果精准运营应用程序和引导用户操作,以有效提升用户活跃度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的贝叶斯网络的示意图;

图2是本申请一个实施例提供的贝叶斯网络的网络结构的示意图;

图3是本申请一个实施例提供的分析系统的示意图;

图4是本申请一个实施例提供的因果性影响的确定方法的流程图;

图5是本申请另一个实施例提供的贝叶斯网络的网络结构的示意图;

图6是本申请一个实施例提供的因果性影响的确定装置的框图;

图7是本申请另一个实施例提供的因果性影响的确定装置的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

在对本申请实施例进行介绍说明之前,先对本申请实施例中涉及的一些名词和相关技术进行介绍说明。

一、贝叶斯网络(Bayesian Network,BN)

贝叶斯网络由以下两部分组成:

1、一个网络结构

也即,一个无环有向图

2、一个关于特征变量X的概率分布,其参数为Θ

其中,X={X

分解公式为:

其中,

请参考图1,其示出了本申请一个实施例提供的贝叶斯网络的示意图。如图1(a)所示,其为本申请实施例提供的一个无环有向图的示意图,其有七个节点。如图1(b)所示,其为图1(a)所示的无环有向图对应的条件独立信息。其中,⊥

需要说明的一点是,在贝叶斯网络中的,如图1(a)所示,因果性可以沿着箭头方向传播;但相关性却既可以沿着箭头方向传播,也可以沿着箭头方向的反方向传播。因此,若某一变量与另一变量之间存在相关性,却并不一定表示该变量对另一变量存在因果效应(或因果性影响)。

例如,假设有一个双变量的贝叶斯网络,两个变量分别代表“城市海拔”和“城市的平均气温”,从物理学角度来说,城市海拔越高,城市的平均气温越低,因此,“城市海拔”是因、“城市的平均气温”是果,箭头方向是从“城市海拔”指向“城市的平均气温”。假设已知“城市的平均气温”比较低,则可以推测出“城市海拔”可能会比较高。这说明“城市的平均气温”与“城市海拔”之间存在相关性,而它是沿着箭头方向的反方向传播的。但是如果通过某种方式提高了城市的平均温度,它的海拔并不会因此降低。这说明沿着箭头方向的反方向无因果效应。

二、用户内在属性、用户外在特征和用户活跃度

用户内在属性是反映用户内在特征的变量,其通常难以直接获取。在一个示例中,用户内在属性包括以下至少一项:用户年龄、用户职业、用户经济收入。由于用户内在属性通常难以直接获取,因此,可以通过调查问卷或者其它激励方式鼓励用户主动填写,以获取用户内在属性。

用户外在特征相比于用户内在属性,通常较为容易获取,可选地,从应用程序的后台数据中可以获取用户外在特征。可选地,用户外在特征包括以下至少一项:用户所使用的终端类型、搭载应用程序的操作系统、注册应用程序的方式(如电话注册、邮箱注册、合作渠道注册等)。

用户活跃度用于描述用户在应用程序中的活跃程度,可选地,用户活跃度也可以从应用程序的后台数据中获取。本申请实施例对用户活跃度的具体内容不作限定,可选地,用户活跃度包括以下至少一项:每日使用应用程序的频率、每日使用应用程序的时长、过去N(N为正数)天内登录应用程序的次数。

基于此,可以构建如图2所示的贝叶斯网络的网络结构。如图2所示,用户外在特征的父节点为用户内在属性;用户活跃度的父节点为用户内在属性和用户外在特征。因此,从用户外在特征到用户活跃度存在两条路径:

1、用户外在特征→用户活跃度;

2、用户外在特征→用户内在属性→用户活跃度。

在上述第2条路径中,由于贝叶斯网络的箭头方向是从用户内在属性至用户外在特征,因此,在第2条路径中,用户外在特征和用户活跃度之间不是“因果”的,却可以是“相关”的。正是由于用户内在属性的存在,为用户外在特征和用户活跃度之间引入了相关性。

由于用户内在属性存在不可控的特点,而用户外在特征在一定程度上是可以干预及修正的。因此,若要提升用户活跃度,则用户外在特征是重要的突破口。基于此,需要分析用户外在特征对用户活跃度的影响,从而有针对性地运营及引导以提升用户活跃度。但正如图2所示的贝叶斯网络,由于用户内在属性的存在,为用户外在特征和用户活跃度之间引入了相关性,在统计学上,可以称用户内在属性为用户外在特征和用户活跃度之间的混淆变量。那么,在考虑用户内在属性的情况下,如何确定用户外在特征对用户活跃度的因果性影响,以提升用户活跃度相关分析的准确性,是亟需解决的技术问题。

基于此,本申请实施例提供了一种因果性影响的确定方法,可用于解决上述技术问题。下面,结合几个实施例对本申请提供的因果性影响的确定方法进行介绍说明。

请参考图3,其示出了本申请一个实施例提供的分析系统的示意图。如图3所示,该分析系统包括:计算机设备310和服务器320。

服务器320是指应用程序的后台服务器,为应用程序提供后台服务。本申请实施例对应用程序的类型不作限定,在一个示例中,应用程序包括直播类应用程序、视频播放类应用程序、短视频类应用程序、社交类应用程序、购物类应用程序、美食类应用程序、出行类应用程序、支付类应用程序、游戏类应用程序、音乐播放类应用程序。可选地,服务器320可以是一台服务器,也可以是多台服务器组成的服务器集群,还可以是一个云计算中心。

在一个示例中,如图3所示,服务器320可以从设备330处获取应用程序的后台数据,可选地,应用程序的后台数据包括以下至少一项:用户活跃度、用户外在特征、用户内在属性。其中,设备330是指安装运行有应用程序的设备,如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、PC(Personal Computer,个人计算机)等电子设备。服务器320获取到应用程序的后台数据后,可以将应用程序的后台数据存储在数据库中。

计算机设备310是指具备数据分析能力的设备,本申请实施例中,计算机设备310可以从服务器320处获取应用程序的后台数据,并利用应用程序的后台数据进行数据分析,如分析用户外在特征对用户活跃度的因果性影响。可选地,在应用程序的后台数据包括用户内在属性的情况下,也即,用户通过设备330填写与用户内在属性相关的信息的情况下,计算机设备310从服务器320处获取用户内在属性;在应用程序的后台数据不包括用户内在属性的情况下,计算机设备310可以直接获取用户内在属性,如通过相关人员手动录入用户内在属性相关的信息。

可选地,计算机设备310与服务器320之间,服务器320与设备330之间可以通过网络进行互相通信,该网络可以是有线网络,也可以是无线网络。

需要说明的一点是,实际应用过程中,计算机设备310和服务器320可以实现为一台设备,也即,计算机设备310也可以同时充当应用程序的后台服务器,或者,服务器320也可以同时具备数据分析的能力。图3实施例仅是为了便于描述,而将计算机设备310和服务器320实现为两台设备,但这不应当对本申请实施例提供的技术方案造成任何限定。

请参考图4,其示出了本申请一个实施例提供的因果性影响的确定方法的流程图。该方法可应用于上述图3实施例所述的计算机设备310中。该方法可以包括如下几个步骤。

步骤410,从应用程序中登录的至少一个用户帐号对应的用户信息中,获取第一用户外在特征对应的至少一组用户信息,每组用户信息包括一个用户帐号对应的用户内在属性、用户外在特征以及用户活跃度。

用户帐号对应的用户信息包括:用户内在属性、用户外在特征以及用户活跃度。在一个示例中,用户内在属性、用户外在特征以及用户活跃度之间的因果性影响关系如下所示:用户内在属性对用户外在特征存在因果性影响;用户内在属性对用户活跃度存在因果性影响;用户外在特征对用户活跃度存在因果性影响。也即,用户内在属性、用户外在特征以及用户活跃度之间的因果性影响关系可以参考上述图2所示的贝叶斯网络的网络结构。有关用户内在属性、用户外在特征以及用户活跃度的相关定义、获取方式等介绍说明,请参见上述实施例,此处不多赘述。

本申请实施例中,用户帐号对应的用户信息可以整理为如下述表一所述的结构化数据,从而,可以在用户信息之间建立对应关系,便于基于用户信息的某一维度,获取所需的数据。例如,计算机设备基于用户信息中的用户外在特征,获取第一外在特征对应的至少一组用户信息。

表一用户帐号对应的用户信息

步骤420,基于至少一组用户信息所包括的用户内在属性,确定每类用户内在属性的出现概率。

基于上述步骤410获取的至少一组用户信息中,每组用户信息所包括的用户外在特征均为第一用户外在特征,但是每组用户信息所包括的用户内在属性以及用户活跃度却可能不同,也可能部分相同,部分不相同。因此,计算机设备可以基于至少一组用户信息所包括的用户内在属性,确定每类用户内在属性出现的概率。可选地,用户内在属性在离散化处理后被分为多个类别,这样可以减少用户内在属性的可能取值,降低计算机设备的处理和分析开销。有关对用户内在属性的离散化处理方式参见下述方法实施例,此处不多赘述。

例如,至少一组用户信息所包括的用户内在属性为u个,u为正整数。假设这u个用户内在属性可以被离散化为多类用户内在属性,且其中一类用户内在属性为v个,v为正整数,则该类用户内在属性的出现概率为p(x)=v/u。

步骤430,基于至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望。

计算机设备除了通过上述步骤420确定每类用户内在属性的出现概率之外,还可以基于至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望。假设第一用户外在特征为t=1,用户内在属性为x,用户活跃度为y,那么,在每类用户内在属性给定时,用户活跃度的数学期望为E(y|t=1,x)。

步骤440,以每类用户内在属性的出现概率为权重,对每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,得到第一因果效应估计量,第一因果效应估计量用于指示第一用户外在特征对用户活跃度的因果性影响。

在分别确定每类用户内在属性的出现概率,以及每类用户内在属性给定时用户活跃度的数学期望之后,计算机设备即可以每类用户内在属性的出现概率为权重,对每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,以得到第一因果效应估计量。假设第一用户外在特征为t=1,用户内在属性为x,用户活跃度为y,在每类用户内在属性给定时用户活跃度的数学期望为E(y|t=1,x),则第一因果效应估计量为:E(y|do(t=1))=∑p(x)E(y|t=1,x)。其中,do(t)表示强制去除了用户内在属性。由于在计算第一因果效应估计量的过程中,是以用户外在特征为第一用户外在特征为基础,因此,第一因果效应估计量用于指示第一用户外在特征对用户活跃度的因果性影响。

从上述第一因果效应估计量的确定过程中,可以看出,因果效应估计量的计算可以通过数学公式E(y|do(t))=∑p(x)E(y|t,x)得到。下面,介绍说明该数学公式的推导过程。

本申请实施例所要实现的方案是估计在用户内在属性X存在的情况下,用户外在特征T对用户活跃度Y的因果效应(因果性影响)。因此,需要假设用户外在特征T是强制设置的,而不是一个与用户内在属性X相关联的变量。从贝叶斯网络的角度,如图5所示,需要切断用户内在属性X与用户外在特征T之间的联系。

在不切断用户内在属性X与用户外在特征T之间的连线时,可以得到如下表达式:

p(Y=y,T=t,X=x)=p(X=x)p(T=t|X=x)p(Y=y|T=t,X=x)。

为便于描述,在本申请实施例中,采用p(y,t,x)=p(x)p(t|x)p(y|t,x)代替上述表达式。

在切断了用户内在属性X与用户外在特征T之间的连线时,可以得到表达式:p(y,x|do(t))=p(x)p(y|t,x)。也即,切断了用户内在属性X与用户外在特征T之间的连线相当于除去了表达式中的p(t|x)这一项。本申请实施例中,do(t)表示强制去除了用户内在属性这一混淆因子。

由于本申请实施例所要实现的方案是确定用户活跃度Y和用户外在特征T之间的关系,因此,将用户内在属性X边缘化(Marginalize)之后,可以得到表达式:p(y|do(t))=∑p(x)p(y|t,x)。若需要确定的是用户活跃度Y的数学期望,则可以得到表达式:E(y|do(t))=∑p(x)E(y|t,x)。其中,E(y|do(t))即为用户外在特征T=t时用户活跃度Y的数学期望,其用于指示用户外在特征T=t对用户活跃度Y的因果性影响。

综上所述,本申请实施例提供的技术方案,通过在估计用户外在特征对用户活跃度的影响时,考虑到用户内在属性在用户外在特征和用户活跃度之间引入的相关性,并将用户内在属性边缘化,从而估计出用户外在特征对用户活跃度的因果性影响,避免将用户外在特征与用户活跃度之间的相关性错误判断为用户外在特征对用户活跃度的影响,提升了用户活跃度相关分析的准确性,有助于后续根据分析结果精准运营应用程序和引导用户操作,以有效提升用户活跃度。

由上述介绍说明可知,对用户内在属性的离散化处理可以减少用户内在属性的可能取值,降低计算机设备的处理和分析开销。下面,介绍说明本申请实施例提供的一种离散化处理的方式。

在一个示例中,用户内在属性的表现形式为离散化数值;上述方法还包括:获取至少一个用户帐号对应的用户内在属性;对至少一个用户帐号对应的用户内在属性进行离散化处理,得到以离散化数值的形式表现的用户内在属性。

计算机设备既可以在上述步骤410之前,对至少一个用户帐号对应的内在属性进行离散化处理,也可以在上述步骤410之后,对至少一个用户帐号对应的内在属性进行离散化处理,本申请实施例对此不作限定。可选地,用户内在属性包括至少一个维度的属性,计算机设备在对用户内在属性进行离散化处理时,既可以对用户内在属性所包括的所有维度的属性进行离散化处理,也可以对用户内在属性所包括的部分维度的属性进行离散化处理。可选地,用户内在属性包括以下至少一个维度的属性:用户帐号对应的用户年龄、用户帐号对应的用户经济收入、用户帐号对应的用户职业。

以计算机设备对至少一个用户帐号所包括的所有维度的属性进行离散化处理为例,上述对至少一个用户帐号对应的用户内在属性进行离散化处理,得到以离散化数值的形式表现的用户内在属性,包括:获取至少一个维度的属性分别对应的分位点信息;基于至少一个维度的属性分别对应的分位点信息,确定至少一个维度的属性分别对应的离散化区间,以及各个离散化区间对应的离散化数值;按照至少一个维度的属性分别对应的离散化区间,以及各个离散化区间对应的离散化数值,对至少一个用户帐号对应的用户内在属性进行离散化处理,得到以离散化数值的形式表现的用户内在属性。

每个维度的属性对应的分位点信息包括该维度的属性对应的至少一个分位点,按照至少一个分位点,可以将该维度的属性离散化为几个区间。例如,某一维度的属性对应的分位点信息包括该维度的属性对应的三个分位点,则按照这3个分位点,可以将该维度的属性离散化为4个区间。通过将用户内在属性所包括的各个维度的属性分别进行离散化处理,可以将用户内在属性表示为多个离散化数值所组成的多维元组。

例如,假设用户内在属性包括用户帐号对应的用户经济收入(E)和用户帐号对应的用户年龄(A)这两个维度的属性,并且,将这两个维度的属性分别按照(0.25,0.5,0.75)这三个分位点离散化为4个离散化数值。对于用户帐号的用户年龄(A)这一维度的属性,假设从至少一个用户帐号对应的用户内在属性分别包括的用户帐号对应的用户年龄中,分析得到用户帐号对应的用户年龄的三个分位点为

综上所述,本申请实施例提供的技术方案,通过按照分位点信息对用户内在属性进行离散化处理,将原本难以控制和预测的用户内在属性的取值,限定在有限的可能范围内,减少了用户内在属性的可能取值,从而,一方面便于规范化地存储,另一方面有助于降低计算机设备在进行用户活跃度相关分析时的处理和分析开销。

由上述实施例的介绍说明可知,用户外在特征对用户活跃度的因果性影响有助于后续根据分析结果精准运营应用程序和引导用户操作。下面,对本申请实施例提供的一种用户外在特征对用户活跃度的因果性影响的应用方法进行介绍说明。

在一个示例中,上述方法还包括:确定至少一个因果效应估计量,每个因果效应估计量用于指示一种用户外在特征对用户活跃度的因果性影响;基于至少一个因果效应估计量,分析至少一种用户外在特征分别对用户活跃度的因果性影响之间的差异。

本申请实施例中,多个用户外在特征分别对用户活跃度的因果性影响之间的差异,可以采用多个用户外在特征给定的情况下,用户活跃度的数学期望的差值来表示。例如,假设第一用户外在特征为t=1,第二用户外在特征t=2,用户内在属性为x,用户活跃度为y,则第一因果效应估计量为E(y|do(t=1))=∑p(x)E(y|t=1,x),第二因果效应估计量为E(y|do(t=2))=∑p(x)E(y|t=2,x),从而第一用户外在特征和第二用户外在特征分别对用户活跃度的因果性影响之间的差异为E(y|do(t=1))-E(y|do(t=2)),或者,为E(y|do(t=2))-E(y|do(t=1))。

通过分析多个用户外在特征对用户活跃度的因果性影响的差异,可以有针对性地对应用程序作出改善,或者对有针对性地引导用户使用应用程序,从而提升应用程序的用户活跃度。可选地,至少一种用户外在特征包括搭载应用程序的至少一个操作系统,上述基于至少一个因果效应估计量,分析至少一种用户外在特征分别对用户活跃度的因果性影响之间的差异之后,还包括:基于分析,确定待参考的操作系统和待优化的操作系统;获取待参考的程序数据包和待优化的程序数据包,待参考的程序数据包是应用程序在待参考的操作系统中的程序数据包,待优化的程序数据包是应用程序在待优化的操作系统中的程序数据包;基于待参考的程序数据包,对待优化的程序数据包进行改进。

其中,待参考的操作系统是至少一个操作系统中对用户活跃度的因果性影响较大的操作系统,待优化的操作系统是至少一个操作系统中对用户活跃度的因果性影响较小的操作系统。通过按照待参考的操作系统中应用程序相关的程序数据包,改进待优化的操作系统中应用程序相关的程序数据包,如在待优化的程序数据包中添加待参考的程序数据包独有的功能,或者模仿待参考的程序数据包所对应的应用程序的运行效果等,可以在各个操作系统中,针对应用程序均实现较高的用户活跃度。

综上所述,本申请实施例提供的技术方案,通过对多个用户外在特征分别对用户活跃度的因果性影响进行分析,并根据分析得到的差异,有针对性地完善应用程序的功能和显示等,或有针对性地引导用户如何使用应用程序等,实现有效提升应用程序的用户活跃度。

下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。

请参考图6,其示出了本申请一个实施例提供的因果性影响的确定装置的框图。该装置具有实现上述因果性影响的确定方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是计算机设备,也可以设置在计算机设备中。该装置600可以包括:信息获取模块610、概率确定模块620、期望确定模块630和估计量计算模块640。

信息获取模块610,用于从应用程序中登录的至少一个用户帐号对应的用户信息中,获取第一用户外在特征对应的至少一组用户信息,每组用户信息包括一个用户帐号对应的用户内在属性、用户外在特征以及用户活跃度。

概率确定模块620,用于基于所述至少一组用户信息所包括的用户内在属性,确定每类用户内在属性的出现概率。

期望确定模块630,用于基于所述至少一组用户信息所包括的用户内在属性和用户活跃度,确定每类用户内在属性给定时用户活跃度的数学期望。

估计量计算模块640,用于以所述每类用户内在属性的出现概率为权重,对所述每类用户内在属性给定时用户活跃度的数学期望进行加权求和处理,得到第一因果效应估计量,所述第一因果效应估计量用于指示所述第一用户外在特征对所述用户活跃度的因果性影响。

在一个示例中,所述用户内在属性、所述用户外在特征以及所述用户活跃度之间的因果性影响关系如下所示:所述用户内在属性对所述用户外在特征存在因果性影响;所述用户内在属性对所述用户活跃度存在因果性影响;所述用户外在特征对所述用户活跃度存在因果性影响。

在一个示例中,所述用户内在属性的表现形式为离散化数值;如图7所示,所述装置600还包括:属性获取模块650,用于获取所述至少一个用户帐号对应的用户内在属性;离散化处理模块660,用于对所述至少一个用户帐号对应的用户内在属性进行离散化处理,得到以离散化数值的形式表现的用户内在属性。

在一个示例中,所述用户内在属性包括至少一个维度的属性;如图7所示,所述离散化处理模块660,用于:获取所述至少一个维度的属性分别对应的分位点信息;基于所述至少一个维度的属性分别对应的分位点信息,确定所述至少一个维度的属性分别对应的离散化区间,以及各个离散化区间对应的离散化数值;按照所述至少一个维度的属性分别对应的离散化区间,以及各个离散化区间对应的离散化数值,对所述至少一个用户帐号对应的用户内在属性进行离散化处理,得到所述以离散化数值的形式表现的用户内在属性。

在一个示例中,所述用户内在属性包括以下至少一个维度的属性:用户帐号对应的用户年龄、用户帐号对应的用户经济收入、用户帐号对应的用户职业。

在一个示例中,如图7所示,所述装置600还包括:估计量确定模块640,还用于确定至少一个因果效应估计量,每个因果效应估计量用于指示一种用户外在特征对用户活跃度的因果性影响;差异分析模块670,用于基于所述至少一个因果效应估计量,分析至少一种用户外在特征分别对用户活跃度的因果性影响之间的差异。

在一个示例中,所述至少一种用户外在特征包括搭载所述应用程序的至少一个操作系统;如图7所示,所述装置600还包括:系统确定模块680,用于基于所述分析,确定待参考的操作系统和待优化的操作系统,所述待参考的操作系统是所述至少一个操作系统中对用户活跃度的因果性影响较大的操作系统,所述待优化的操作系统是所述至少一个操作系统中对用户活跃度的因果性影响较小的操作系统;数据包获取模块690,用于获取待参考的程序数据包和待优化的程序数据包,所述待参考的程序数据包是所述应用程序在所述待参考的操作系统中的程序数据包,所述待优化的程序数据包是所述应用程序在所述待优化的操作系统中的程序数据包;数据包改进模块600,用于基于所述待参考的程序数据包,对所述待优化的程序数据包进行改进。

综上所述,本申请实施例提供的技术方案,通过在估计用户外在特征对用户活跃度的影响时,考虑到用户内在属性在用户外在特征和用户活跃度之间引入的相关性,并将用户内在属性边缘化,从而估计出用户外在特征对用户活跃度的因果性影响,避免将用户外在特征与用户活跃度之间的相关性错误判断为用户外在特征对用户活跃度的影响,提升了用户活跃度相关分析的准确性,有助于后续根据分析结果精准运营应用程序和引导用户操作,以有效提升用户活跃度。

需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

在示例性实施例中,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述因果性影响的确定方法。

在示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述因果性影响的确定方法。

在示例性实施例中,还提供一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得计算机设备执行如上述因果性影响的确定方法。

以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号