首页> 中国专利> 一种基于用户和产品层面的多因子在线购买行为转化预测方法

一种基于用户和产品层面的多因子在线购买行为转化预测方法

摘要

本发明公开了一种基于用户和产品层面的多因子在线购买行为转化预测方法,其特征在于它基于用户一系列页面访问事件,提取用户浏览历史中的预测因子,获得各预测因子导致的用户购买概率;结合产品层面的桥梁常数将获得的用户购买概率聚合获得用户转化基数η[t0:t0+△t](p),η[t0:t0+△t](p)表示用户c在时间△t内购买产品p的概率。将本发明预测方法与5种基准方法预测结果进行误差分析,本发明预测方法的RMSE值最低、PCC值最高,表明本方法具有较高的准确性。

著录项

说明书

技术领域

本发明涉及电子商务领域,并且更具体地涉及一种基于用户和产品层面的多因子在线购买行为转化预测方法。

背景技术

随着电子商务的深入发展,电商网站及电商消费者规模呈现激增态势,用户在线购买习惯得以迅速形成,同时带来了海量的产品信息和消费者在线行为数据,如何从海量的数据中提取和分析出有价值的用户行为信息,较为准确的预测用户偏好和购买行为,进而提高产品的购买转化率,是企业提升竞争力的一个重要方面。

专利“基于用户的行为顺序预测购买概率的方法及其设备”(专利申请号201810745481.7),发明了一种预测用户购买概率的方法及其设备,该方法和设备将实时收集到的访问购物网站的用户日志按时间顺序排列,生成与用户的在线行为相对应的统一资源标识符(URI)序列,通过将URI序列与对应于购物网站的购买概率模型进行比较来计算用户的产品购买概率,该专利提升了检测用户当前购买意图的准确性。

专利“一种预测用户购买商品行为的方法和装置”(专利申请号201610356742.7),提供了一种预测用户购买商品行为的方案,该方案同时考虑了商品特征向量序列G、用户特征向量U以及序列G之前的时间差因素,主要解决了现有技术中存在的预测准确度较低的缺陷。

专利“一种基于移动大数据的用户购买意向预测方法”(专利申请号201910021407.5),涉及一种基于移动大数据的用户购买意向预测方法,包括根据用户、商品基本信息进行特征工程构建,建立多个机器学习模型,同时对模型进行融合,并优化模型网络参数优。通过大数据和算法构面向建移动电子商务的商品推荐模型,预测用户购买意向,为移动用户精准推荐合适的内容。

以上三个技术方案均存在以下缺陷:用户购买行为转化在线预测的准确性不高;相关产品精准推荐的准确度不高。

发明内容

为解决背景技术中存在的问题,本发明通过整合用户购物行为多样化、产品兴趣水平和产品类型,构建产品和客户模式转换的相互依赖关系,提出用户-产品多因子联合预测模型,在提高浏览客户转换率的基础上,最好的估计给定产品,根据产品转化率进行产品推荐。

技术方案:

本发明公开了一种基于用户和产品层面的多因子在线购买行为转化预测方法,它基于用户一系列页面访问事件,提取用户浏览历史中的预测因子,获得各预测因子导致的用户购买概率;结合产品层面的桥梁常数将获得的用户购买概率聚合获得用户转化基数η

优选的,所述预测因子包括购买转移B

购买转移:采用用户转移权重W来表示用户购买概率

Z(c,p

浏览比率B

Y

浏览时间B

Y

优选的,浏览持续时间x

定义(c,p)为客户-产品配对,定义配对之间的三个过渡态为{inactive,active,adopt},每一对(c,p)最初都处于inactive状态,这表示客户c尚未意识到对p的需求;接下来,如果(c,p)对变为active状态则就意味着用户对p产品的需求,当c开始访问产品页面时,active状态可以被识别;若客户c在(c,p)达到active状态后访问不同的页面,(c,p)仍保持active状态;当客户c对产品p做出采购订单时,(c,p)变成了adopt状态;到达adopt状态后,这对(c,p)立即返回到inactive状态;

浏览持续时间x

优选的,用户转化基数的计算公式为:

其中,C

优选的,用户一系列页面访问事件用v=(c

优选的,页面点击流使用RecSys 2015数据集在内的9300万条用户log日志和点击流事件。

优选的,它还包括转化误差的修正步骤。

优选的,使用朴素回归算法对购买转移的转换误差进行修正:

使用x

给定任意两个集合X和Y,通过学习得到线性回归方程的斜率β

定义线性回归方程Y=α

式中,

优选的,使用周期感知回归模型对回归预测时间段进行修正:基于模拟的数据集,包括RecSys2015数据集和不公开的电子商务数据集,通过周期感知回归模型,重新有效评估三个采购因素的总和根据给定的产品和给定的性质预测时间段。

优选的,使用正相协PA修正方法来影响产品层面的预测性能:基于用户log日志和点击流事件数据,通过PA修正方法将实际观察到的用户购买概率与估计的用户购买概率相耦合。

本发明的有益效果

将本发明方法与C-MLE最大似然估计、C-NBR推荐系统模型、C-AVE页面累计访问的方法、P-HCR历史转化率模型、P-HCC历史转化基数方法比较(利用均方根误差RMSE与皮尔森相关系数PCC进行验证),本方法在用户购买行为转化在线预测的准确性和相关产品精准推荐的准确度方面均有较大提高。

附图说明

图1为单个和组合预测因子对转化预测概率的影响示意图,其中:

图1(a)为“购买转移”单个对转化预测概率的影响示意图

图1(b)为“浏览率+浏览时长”的组合对转化预测概率的影响示意图

图1(c)为“购买转移+浏览率+浏览时长”的组合对转化预测概率的影响示意图

图2为修正用户和产品层面的预测模型转化误差示意图,其中:

图2(a)为经朴素回归修正后的预测值误差示意图

图2(b)为PA和NA修正后的预测值误差对比图

图3为本文预测方法与基准方法的性能比较示意图

图3(a)为本文预测方法与基准方法的进行RMSE验证的性能比较示意图

图3(b)为本文预测方法与基准方法的进行PCC验证的性能比较示意图

图4为本发明的方法流程图

具体实施方式

下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:

基于用户和产品层面的多因子在线购买行为转化预测方法包括:定义大规模用户在线页面访问数据集格式、定义转换预测问题、构建基于用户和产品层面的转化预测模型、预测因子的影响性分析、修正用户和产品层面的预测模型转化误差和利用RMSE与PCC衡量本预测方法的优越性。结合图4,具体实施方法如下:

步骤1、定义大规模用户在线页面访问数据集格式:对于给定的电子商务网站,定义唯一的客户ID,汇总用户操作日志;定义用户页面访问活动v,v=(c

步骤2、定义转换预测问题:基于步骤1的用户数据,定义两个预测问题转换候选对和转换模拟,给定网络日志,c表示一组客户的有限集,p表示一组产品的有限集。我们定义(c,p)为客户-产品配对,定义配对之间的三个过渡态为{inactive,active,adopt}:每一对(c,p)最初都处于inactive状态,这表示客户c尚未意识到对p的需求;接下来,如果(c,p)对变为active状态则就意味着用户对p产品的需求,当c开始访问产品页面时,active状态可以被识别。当客户c在(c,p)达到active状态后访问不同的页面(不是p的页面),(c,p)仍保持active状态;最后,当c对p产品做出采购订单时,这时(c,p)变成了adopt状态。到达adopt状态后,这对(c,p)立即返回到inactive状态。形式上,转换候选人对可以被定义为客户的集合(表示为C

步骤3、构建基于用户和产品层面的转化预测模型:从用户浏览历史中提取三个预测因子:购买转移(B

步骤4、预测因子的影响性分析:分析用户层面购买转移、浏览比率和浏览时长三个预测因子单个或者组合对转化概率的影响,图1给出了单个和组合预测因子对转化预测概率的影响;购买转移因素导致的用户购买概率为w、浏览比率因素导致的用户购买概率为

购买转移:这种转变可以确定购买相同或不同产品之间的购买需求,G(P,V,W)表示一个有权有向的节点的购买转移图,P={P

浏览比率:通过用户页面的累计访问量可以得出用户对哪些产品感兴趣,随着页面访问量的增加,转化的可能性也会增加,访问次数与转化比率成正比例关系。

量化转换候选人的累积访问效果对(c,p),估计转化比率:

Y

浏览时长:将用户分成两组,一组为购买成功的买家,一组为橱窗购物者,比较两者访问p页面的时长(从active状态到adopt状态的时间或最后一次访问p页面的时长),生成浏览时间的随机变量和概率密度函数吗,基于两个顾客群体和浏览持续时间的概率密度函数,估计给定对(c,p)的转换概率:

Y

产品因素聚合,获得用户转化基数的计算公式为:

步骤5、修正用户和产品层面的预测模型转化误差;

朴素回归:为了修正基于用户层面的购买转移的误差,使用逻辑回归来捕捉更多的用户历史行为,使用x来作为实际观察到的转化基数,y

周期感知回归:对于任意一个时间△t,理想状态下的线性回归在不同的时间周期内变化是近似一致的,利用周期感知回归可以有效地重新评估三个采购因素的总和根据给定的产品和给定的性质预测时间段。

利用PA和NA修正方法影响产品层面的预测性能,更优的实施例中,选择NA修正方法影响产品层面的预测性能。

有益效果验证,利用RMSE和PCC衡量本预测方法的优越性;

实验数据集包括RecSys 2015数据集在内的9300万条用户的log日志、用户的点击流事件;

实验参数设置:设定时间周期△t∈{7,14,21,30,45,60}。

图1中显示预测因子单个和组合对转化率的影响,从结果可知这些因子单个和组合对转化预测概率具有正向影响,且预测因子组合起来的PCC最高,产品的实际转化基数和估计转化基数匹配更加基准,说明本发明方法具有很好的性能。

图2(a)中显示经朴素回归修正后的预测值误差具有较低的RMSE,效果较好;图2(b)中显示经PA和NA方法修正后的预测值误差,且PA的修正效果要比NA好,PA修正方法能够更好的将实际观察到的用户购买概率与估计的用户购买概率相耦合。

图3中显示了本发明预测方法与5种基准方法预测结果的误差分析,本发明预测方法的RMSE值最低、PCC值最高,表明本方法具有较高的准确性。

本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号