首页> 中国专利> 用户生命价值周期检测方法、装置和计算机设备

用户生命价值周期检测方法、装置和计算机设备

摘要

本申请涉及一种用户生命价值周期检测方法、装置、计算机设备和存储介质。获取用户账号对应的行为数据;将该行为数据输入训练好的分类模型,得到用户账号对应的用户类型;分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;若用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定用户账号对应的用户的生命价值周期LTV;若该用户类型为第二用户类型,将用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,预测模型是基于属于第二用户类型的历史行为数据训练得到。利用用户的历史行为数据确定用户类型,再针对不同用户类型分别确定用户LTV,减小了用户LTV检测的误差。

著录项

  • 公开/公告号CN112258238A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 深圳市九九互动科技有限公司;

    申请/专利号CN202011188855.3

  • 发明设计人 李炜铭;

    申请日2020-10-30

  • 分类号G06Q30/02(20120101);G06K9/62(20060101);

  • 代理机构44224 广州华进联合专利商标代理有限公司;

  • 代理人吴平

  • 地址 518051 广东省深圳市南山区粤海街道粤桂社区白石路3818号阳光粤海花园二期3栋1502

  • 入库时间 2023-06-19 09:40:06

说明书

技术领域

本申请涉及移动应用技术领域,特别是涉及一种用户生命价值周期检测方法、装置、计算机设备和存储介质。

背景技术

随着移动设备的全方面覆盖,移动应用市场得到了迅速的发展。目前为止AppStore和Google Play Store的移动应用都有上百万个。尽管移动应用数量激增,但是用户实际使用的应用数量却在缓慢下降,数据显示用户在更少的应用上花费更多的时间。除了留住现有用户,还需要使用高效、精准的推广方法获取新用户。对于一款应用来说,获取新用户的方式很多,如:广告投放、商城推荐、好友推荐等,其中广告投放获得的新用户占全部新用户的70%左右。广告投放需要可控的成本,合理的选择渠道,精准的检测用户LTV(Lifetime Value,生命周期价值),从而最大化投入产出比。

传统的用户LTV检测方法采用拟合法,拟合用户LTV随时间的变化函数,进而检测用户LTV。

但是拟合法不能准确的得到用户的LTV函数,因此检测的用户LTV误差较大。

发明内容

基于此,有必要针对上述技术问题,提供一种能够准确检测用户生命价值周期的用户生命价值周期检测方法、装置、计算机设备和存储介质。

一种用户生命价值周期检测方法,该方法包括:

获取用户账号对应的行为数据;

将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

若该用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

若该用户类型为第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

在其中一个实施例中,获取用户账号对应的行为数据之后还包括:对该用户账号对应的行为数据进行预处理,得到预处理后的用户账号的行为数据。

在其中一个实施例中,对该用户账号对应的行为数据进行预处理,包括:将该用户账号的行为数据按照数值型和非数值型进行分类,得到数值型的行为数据和非数值型的行为数据;将该非数值型的行为数据进行特征编码,得到编码后的非数值型的行为数据;将该数值型的用户账号的行为数据和编码后的非数值型的用户账号的行为数据进行合并,得到预处理后的用户账号的行为数据。

在其中一个实施例中,该用户账号对应的行为数据包括:用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息。

在其中一个实施例中,该分类模型的训练过程包括:将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,以及将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本;根据该正样本和负样本对初始分类模型进行训练,得到训练好的分类模型。

在其中一个实施例中,该预测模型的训练过程包括:获取训练样本,该训练样本包括属于第二用户类型的样本用户账号对应的历史行为数据及该样本用户账号对应的用户生命价值周期,均方根误差作为损失函数,得到训练好的预测模型。

在其中一个实施例中,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV,包括:根据预设属性值和预设时段内属于第一用户类型的用户数量相乘,得到该用户账号对应的用户的生命价值周期LTV。

一种用户生命价值周期预测装置,该装置包括:

获取模块,用于获取用户账号对应的行为数据;

分类模块,用于将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

第一确定模块,用于若该用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

第二确定模块,用于若该用户类型为第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现以下步骤:

一种用户生命价值周期检测方法,该方法包括:

获取用户账号对应的行为数据;

将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

若该用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

若该用户类型为第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:

一种用户生命价值周期检测方法,该方法包括:

获取用户账号对应的行为数据;

将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

若该用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

若该用户类型为第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

上述用户生命价值周期检测方法、装置、计算机设备和存储介质,获取用户账号对应的行为数据;将用户账号的行为数据输入训练好的分类模型,得到用户账号对应的用户类型;分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;若用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定用户账号对应的用户的生命价值周期LTV;若该用户类型为第二用户类型,将用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,预测模型是基于属于第二用户类型的历史行为数据训练得到。利用用户的历史行为数据确定用户类型,再针对不同用户类型分别确定用户LTV,减小了用户LTV检测的误差。

附图说明

图1为一个实施例中用户生命价值周期检测方法的应用环境图;

图2为一个实施例中用户生命价值周期检测方法的流程示意图;

图3为一个实施例中用户生命价值周期检测方法的逻辑示意图;

图4为另一个实施例中用户生命价值周期检测方法的逻辑示意图;

图5为一个实施例中用户生命价值周期检测装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的用户生命价值周期检测方法,可以应用于如图1所示的应用环境中。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。

在一个实施例中,如图2所示,提供了一种用户生命价值周期检测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤202,获取用户账号对应的行为数据。

具体地,用户账号对应的行为数据包括用户账号的基本信息以及用户账号在对应的应用场景中操作服务所产生的行为数据,用户账号对应的行为数据储存在数据中心的数据库中。可选的,用户账号对应的行为数据可以包括用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息等,终端通过获取接口定时从数据中心的数据库中获取用户账号对应的行为数据,这里的定时可以为新用户账号注册后的7天、10天、15天或者其他天数,在此不做限定。本申请实施例中的应用场景可以是游戏场景或者其他业务场景,比如视频会议业务场景、视频播放业务场景等其他业务场景,本申请实施例中的用户账号的行为数据是以游戏业务场景为实例进行说明,其他业务场景中的用户账号的行为数据也同样可以适用于本申请实施例所提供的用户生命价值周期检测方法。

步骤204,将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到。

具体地,训练好的分类模型用于根据用户账号对应的行为数据确定用户账号对应的用户类型,这里的用户类型包括第一用户类型和第二用户类型,第一用户类型可以为非付费用户,第二用户类型可以为付费用户,分类模型是将第一用户类型的历史行为数据和第二类用户的行为数据作为训练样本,将用户账号对应的历史行为数据作为特征,通过多次有放回的随机抽样操作,得到多个训练样本的训练集,对于每个训练集,从用户账号对应的行为数据的特征中随机选择k个特征,选择最佳分割特征作为决策树的节点建立决策树模型,建立有多个决策树模型的随机森林模型,d为用户账号对应的行为数据的特征值的个数,k一般为以2为底的特征值个数的对数值。

步骤206,若该用户类型为该第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV。

具体地,预设属性值为预设时间段内第一用户类型的平均付费值,可以为非付费用户的平均付费值,预设时间段是指用户账号对应的行为数据的获取的时间段,可以为7天、10天、30天或者其他天数,在此不做限定,根据第一用户类型的平均付费值和预设时间段内使用上述训练好的分类模型分类为第一用户类型的用户数量进行数学运算,得到第一用户类型的生命价值周期,也就是非付费用户的期望付费值。可选的,可以根据第一用户类型的平均付费值与每日分类为第一用户类型的用户数量相乘得到第一用户类型的生命价值周期,也可以根据第一用户类型的平均付费值与每日分类为第一用户类型的用户数量相乘之后再乘以一个系数得到第一用户类型的用户生命价值周期。

步骤208,若该用户类型为该第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

具体地,训练好的预测模型用于根据分类为第二用户类型对应的历史行为数据作为训练样本,第二用户类型的生命价值周期作为训练目标,通过将第二用户类型的历史行为数据的属性分割来构建回归树,训练得到多棵回归树,每棵树的叶子节点对应一个分数,最后将每个叶子节点对应的分数相加就得到第二用户类型的生命价值周期,也就是付费用户的付费值。

上述用户生命价值周期检测方法中,获取用户账号对应的行为数据;将用户账号的行为数据输入训练好的分类模型,得到用户账号对应的用户类型;分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;若用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定用户账号对应的用户的生命价值周期LTV;若该用户类型为第二用户类型,将用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,预测模型是基于属于第二用户类型的历史行为数据训练得到。利用用户的历史行为数据确定用户类型,再针对不同用户类型分别确定用户LTV,减小了用户LTV检测的误差。

在一个实施例中,获取用户账号对应的行为数据之后还包括:对该用户账号对应的行为数据进行预处理,得到预处理后的用户账号的行为数据。

具体地,终端获取到用户账号对应的行为数据之后,对用户账号对应的行为数据进行预处理,预处理是指对用户账号对应的行为特征进行规范化处理,规范化处理包括数据清洗和特征编码,数据清洗是指纠正获取到的用户账号对应的行为数据中的错误信息,删除重复信息,保证数据的一致性。特征编码是指将数据清洗后的用户账号对应的行为数据进行独热编码,例如用户账号对应的行为数据可以为用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息等,这些信息有些是数值型的数据,例如付费信息等,还有一些信息是非数值型的信息,例如社交信息、游戏行为信息及其对应的游戏信息等,可选的,预处理可以为将社交信息、游戏行为信息及其对应的游戏信息等非数值型的信息进行编码转换为数值型的信息。

在一个实施例中,对该用户账号对应的行为数据进行预处理,包括:将该用户账号的行为数据按照数值型和非数值型进行分类,得到数值型的行为数据和非数值型的行为数据;将该非数值型的行为数据进行特征编码,得到编码后的非数值型的行为数据;将该数值型的用户账号的行为数据和编码后的非数值型的用户账号的行为数据进行合并,得到预处理后的用户账号的行为数据。

具体地,对用户账号对应的行为数据进行预处理首先要对用户账号对应的行为数据进行清洗,然后进行分类,再对分类后的需要特征编码的用户账号对应的行为数据进行编码,使得所有的用户账号对应的行为数据变得规范。将用户账号对应的行为数据按照数值型和非数值型进行分类,比如将付费信息分类为数值型信息,将基本信息、社交信息、游戏行为及其对应的游戏信息等分类为非数值型信息,然后将非数值型信息进行独热编码,比如基本信息中性别特征男和女,可以将男进行独热编码得到对应的数值信息10,将女进行独热编码得到对应的数值信息01,独热编码后的信息只有一位有效,也就是只有一位为1,其他位都是0。将编码后的非数值型的用户账号的行为数据与数值型的用户账号的行为数据合并,得到预处理后的用户账号的行为数据,有利于预测模型中的特征相似度的计算。

在一个实施例中,该用户账号对应的行为数据包括:用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息。

具体地,用户账号对应的行为数据包括用户账号的基本信息和用户账号对应的其他行为数据,其他行为数据可以是付费信息、社交信息、游戏行为信息及其对应的游戏信息等。其中,用户的基本信息可以为用户的国家、性别、年龄等,付费信息可以为用户在应用场景中操作对象时的支付金额、通过付费得到的礼包数量等付费相关的信息,社交信息可以为用户的好友数量、用户在应用场景中与好友或者应用场景中的公会中的其他用户的互动信息,游戏行为信息可以为在应用场景中对服务对象进行的操作,例如上线、游戏中的攻击行为或者视频播放中的观看付费视频等与操作服务相关的行为,游戏行为信息及其对应的游戏信息是指上线之后积分增加、游戏中攻击成功后获得金币、在视频播放中观看付费视频积分增加等与操作服务后产生的相关的信息。

在一个实施例中,该分类模型的训练过程包括:将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,以及将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本;根据该正样本和负样本对初始分类模型进行训练,得到训练好的分类模型。

具体地,如图3所示,将用户账号对应的历史行为数据作为训练样本,F2-分数函数作为评估函数,训练得到分类模型。例如使用随机森林模型作为分类模型,将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本,F2-分数函数作为评估函数,在SageMaker服务中对随机森林模型的参数进行训练,得到训练好的随机森林模型,也可以用其他方式对分类模型进行训练,只要能够得到比较好的分类模型即可。

在一个实施例中,该预测模型的训练过程包括:获取训练样本,该训练样本包括属于第二用户类型的样本用户账号对应的历史行为数据及该样本用户账号对应的用户生命价值周期,均方根误差作为损失函数,得到训练好的预测模型。

具体地,如图3所示,在训练好的分类模型中对用户账号进行分类,确定用户账号对应的用户类型,当用户账号对应的用户类型为第二用户类型,获取第二用户类型的历史行为数据作为训练样本,将第二用户类型的用户生命价值周期作为训练目标,均方根误差作为损失函数,训练得到预测模型。例如,第二用户类型为付费用户,将付费用户7注册7天内的历史行为数据作为训练样本,付费用户的生命价值周期作为训练目标,使用均方根误差作为损失函数,也就是评估函数,使用XGBoost(eXtreme Gradient Boosting,梯度提升决策树)作为预测模型,在SageMaker服务中对XGBoost模型的参数进行训练,得到训练好的预测模型。

在一个实施例中,该根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV,包括:根据预设属性值和预设时段内属于第一用户类型的用户数量相乘,得到该用户账号对应的用户的生命价值周期LTV。

具体地,如图4所示,预设属性值为预设时间段内第一用户类型的平均付费值,平均付费值是根据预设时间段内分类为第一用户类型的所有用户的实际总付费值和第一用户类型的用户数量相除得到的,然后根据每日第一用户类型的用户数量和第一用户类型的平均付费值进行数学运算得到第一用户类型的生命价值周期。例如,预设时间段为7天,获取用户账号在注册7天内的行为数据,将用户账号在注册7天内的行为数据输入训练好的分类模型中,确定用户账号的对应的用户类型,将第一用户类型的平均付费值与每日第一用户类型的用户数量相乘,得到第一用户类型对应的用户的生命价值周期LTV。

本实施例中,通过获取用户账号对应的行为数据;将用户账号的行为数据输入训练好的分类模型,得到用户账号对应的用户类型;分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;若用户类型为第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定用户账号对应的用户的生命价值周期LTV;若该用户类型为第二用户类型,将用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,预测模型是基于属于第二用户类型的历史行为数据训练得到。利用用户的历史行为数据确定用户类型,再针对不同用户类型分别确定用户LTV,减小了用户LTV检测的误差。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种生命价值周期检测装置,包括:获取模块502、分类模块504、第一确定模块506和第二确定模块508,其中:

获取模块502,用于获取用户账号对应的行为数据。

分类模块504,用于将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到。

第一确定模块506,用于若该用户类型为该第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV。

第二确定模块508,用于若该用户类型为该第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

在一个实施例中,获取模块502获取用户账号对应的行为数据之后还包括:预处理模块用于对该用户账号对应的行为数据进行预处理,得到预处理后的用户账号的行为数据。

在一个实施例中,预处理模块对该用户账号对应的行为数据进行预处理,包括:预处理模块的子模块预处理分类模块用于将该用户账号的行为数据按照数值型和非数值型进行分类,得到数值型的行为数据和非数值型的行为数据;预处理模块的子模块预处理编码模块用于将该非数值型的行为数据进行特征编码,得到编码后的非数值型的行为数据;预处理模块的子模块预处理合并模块用于将该数值型的用户账号的行为数据和编码后的非数值型的用户账号的行为数据进行合并,得到预处理后的用户账号的行为数据。

在一个实施例中,用户账号对应的行为数据单元包括:用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息。

在一个实施例中,分类模块504的子模块分类模型的训练过程模块包括:将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,以及将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本;分类模型的训练过程模块根据该正样本和负样本对初始分类模型进行训练,得到训练好的分类模型。

在一个实施例中,分类模块504的子模块预测模型的训练过程模块包括:预测模型的训练过程模块用于获取训练样本,该训练样本包括属于第二用户类型的样本用户账号对应的历史行为数据及该样本用户账号对应的用户生命价值周期,均方根误差作为损失函数,得到训练好的预测模型。

在一个实施例中,第一确定模块506用于根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV,包括:根据预设属性值和预设时段内属于第一用户类型的用户数量相乘,得到该用户账号对应的用户的生命价值周期LTV。

关于用户生命价值周期检测装置的具体限定可以参见上文中对于用户生命价值周期检测方法的限定,在此不再赘述。上述用户生命价值周期检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种用户生命价值周期检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取用户账号对应的行为数据;

将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

若该用户类型为该第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

若该用户类型为该第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取用户账号对应的行为数据之后还包括:对该用户账号对应的行为数据进行预处理,得到预处理后的用户账号的行为数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:对该用户账号对应的行为数据进行预处理,包括:将该用户账号的行为数据按照数值型和非数值型进行分类,得到数值型的行为数据和非数值型的行为数据;将该非数值型的行为数据进行特征编码,得到编码后的非数值型的行为数据;将该数值型的用户账号的行为数据和编码后的非数值型的用户账号的行为数据进行合并,得到预处理后的用户账号的行为数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:该用户账号对应的行为数据包括:用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:该分类模型的训练过程包括:将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,以及将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本;根据该正样本和负样本对初始分类模型进行训练,得到训练好的分类模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:预测模型的训练过程包括:获取训练样本,该训练样本包括属于第二用户类型的样本用户账号对应的历史行为数据及该样本用户账号对应的用户生命价值周期,均方根误差作为损失函数,得到训练好的预测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV,包括:根据预设属性值和预设时段内属于第一用户类型的用户数量相乘,得到该用户账号对应的用户的生命价值周期LTV。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取用户账号对应的行为数据;

将该用户账号的行为数据输入训练好的分类模型,得到该用户账号对应的用户类型;该分类模型是基于第一用户类型的历史行为数据和第二用户类型的历史行为数据训练得到;

若该用户类型为该第一用户类型,根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV;

若该用户类型为该第二用户类型,将该用户账号对应的行为数据输入到训练好的预测模型,得到第二类用户的LTV,该预测模型是基于属于第二用户类型的历史行为数据训练得到。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取用户账号对应的行为数据之后还包括:对该用户账号对应的行为数据进行预处理,得到预处理后的用户账号的行为数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对该用户账号对应的行为数据进行预处理,包括:将该用户账号的行为数据按照数值型和非数值型进行分类,得到数值型的行为数据和非数值型的行为数据;将该非数值型的行为数据进行特征编码,得到编码后的非数值型的行为数据;将该数值型的用户账号的行为数据和编码后的非数值型的用户账号的行为数据进行合并,得到预处理后的用户账号的行为数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:该用户账号对应的行为数据包括:用户账号的基本信息、付费信息、社交信息、游戏行为信息及其对应的游戏信息。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:该分类模型的训练过程包括:将属于第一用户类型的样本用户账号及对应的历史行为数据作为负样本,以及将属于第二用户类型的样本用户账号及对应的历史行为数据作为正样本;根据该正样本和负样本对初始分类模型进行训练,得到训练好的分类模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:预测模型的训练过程包括:获取训练样本,该训练样本包括属于第二用户类型的样本用户账号对应的历史行为数据及该样本用户账号对应的用户生命价值周期,均方根误差作为损失函数,得到训练好的预测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据预设属性值和预设时段内属于第一用户类型的用户数量,确定该用户账号对应的用户的生命价值周期LTV,包括:根据预设属性值和预设时段内属于第一用户类型的用户数量相乘,得到该用户账号对应的用户的生命价值周期LTV。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号