首页> 中国专利> 基于需求方与商品之间的关系模型的需求意向度预测方法

基于需求方与商品之间的关系模型的需求意向度预测方法

摘要

一种基于需求方与商品之间的关系模型的需求意向度预测方法,通过建模和预测对需求方意向度进行更为准确的推断,进而帮助供应链下游人员利用模型的预测打分更好地将精力集中在意向度较高的需求方身上,从而增强需求方和物品之间的匹配度,提高需求方总体满意度。

著录项

  • 公开/公告号CN116051168A

    专利类型发明专利

  • 公开/公告日2023-05-02

    原文格式PDF

  • 申请/专利号CN202310022714.1

  • 申请日2023-01-08

  • 分类号G06Q30/0202(2023.01);G06N3/042(2023.01);G06N3/045(2023.01);G06N3/0499(2023.01);G06N3/08(2023.01);G06F18/243(2023.01);

  • 代理机构上海交达专利事务所 31201;上海交达专利事务所 31201;

  • 代理人王毓理;王锡麟

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2023-06-19 19:32:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-02

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及的是一种神经网路应用领域的技术,具体是一种基于需求方与商品之间的关系模型的需求意向度(Demand Intention)预测方法。

背景技术

近年来,随着数字经济的提出和大力推行,大数据(Big data)及人工智能(Artificial Intelligence)也相应地快速发展起来,这些技术不仅引起计算机领域的大变革,也为供应链调度行业的数字化转型创新带来视角与工具。借助互联网等新型信息技术,能够采集需求方的数据特征。通过数据挖掘(Data Mining)与机器学习等技术可以实现更好的需求方体验与更精准的营销服务,随着海量行为数据的积累与沉淀,信息化价值也逐渐从”业务支撑“向”推动变革“转变;信息化驱动从”业务驱动“向”数据驱动“转变。

以往在供应链调度行业中,需求方信息的搜集与需求方意向度判断完全依赖于供应链下游人员,通过电话、线下等各种方式获取需求方的信息,并且由供应链下游人员根据信息判断需求方对物品的意向度如何,这种方式非常消耗供应链下游人员的时间精力,容易在许多不愿意采购物品的需求方身上花费过多时间。规划使用的数据链路会同时使用线上小程序、线下供应链下游的数据作为需求方信息,设计的机器学习模型能以远高于人工的效率判断需求方的意向度。

考虑到实体供应链下游行业的特点和现实工业界问题,用于建模需求方意向度的模型有三个困难:第一,从数据获取的角度上来说,相比于理论中的模型训练数据,产生于真实行业的数据会有较多的空缺值,导致模型训练时会损失很多信息,并且由于不是专业的数据标注人员做的标注,在数据标签上也有不统一不规范的问题,另外,在数字化转型的过程中,以往全人工的数据和现在半人工半自动读取的信息需要做融合统一,这两者相应的数据格式和数据分布会有一定差别。第二,某些高耐久物品对需求方来说采购次数较稀少,相比于采购小物品的成交量和成交速度,高耐久物品对应的采购正样本数目会非常稀疏,不利于模型的训练和收敛。第三,需求方对于高耐久物品会比小物品更理性,更不易受到其他因素干扰,这要求用于模型训练的数据更加精确,也对模型的预测准确度提出更高的要求。

除这三个难点之外,还有一个特点与其他的需求方意向度预测问题有区别。展现需求方意向度一般有多个指标,以现有的推荐领域中的需求方意向度预测的方法为例,需求方会先点击,再激活,再转化,分别代表需求方点击页面、下载app或激活商品、app内付费或下单商品,这三个指标递进式的代表需求方意向度的大小,越在转化链路的后侧说明需求方意向度越强。现有的推荐领域中的需求方意向度预测方法主要的目标是最后的转化,因为只有当发生转化商家才会得到实际的回报。因此前两个指标点击、激活是用来辅助最后转化的预测的。在高耐久物品的建模内,指标也有三种,到访实体店铺、预签约、实际认购,从前往后需求方变得稀疏,代表的意向度也变大,指标是类似的,主要的目标也类似,都是为促成更多最终的实际认购,不过区别在于供应链行业有大量的供应链下游人员活跃在接触客户的一线,下游人员针对客户意愿度的建模和预判在现阶段稳稳超过大数据模型的预测,因此大数据模型不用像推荐系统一样以最终的转化为主要目标并且想办法优化,是可以以第一步到访实体店铺作为主要目标去优化到访的预测准确度。一言以蔽之,建模需求方与高耐久物品匹配的模型目标是为供应链下游人员初筛高意向度的需求方,不是为预测最终的转化成功率。

发明内容

本发明针对现有技术存在的上述不足,提出一种基于需求方与商品之间的关系模型的需求意向度预测方法,通过建模和预测对需求方意向度进行更为准确的推断,进而帮助供应链下游人员利用模型的预测打分更好地将精力集中在意向度较高的需求方身上,从而增强需求方和物品之间的匹配度,提高需求方总体满意度。

本发明是通过以下技术方案实现的:

本发明涉及一种基于需求方与商品之间的关系模型的需求意向度预测方法,包括:

步骤1、将需求方意愿度建模为多级转化链路的序列化行为模型,即需求方的不同行为可以反映其不同的意愿度,且行为之间大概率有前置条件的关系。

所述的多级转化链路的最终付款概率为p(b)=p(i2v)*p(v2c)*p(c2b)+p(i2v)*p(v2b)+p(i2b),其中:需求方初始状态为init,简写i,到访为visited,简写v,签约为contract,简写c,认购为buy,简写b;链路的第一部分概率是从初始状态到到访概率*从到访到签约的概率*从签约到认购的概率,代表这部分需求方是按顺序走完整的转化链路,第二部分概率是从初始状态到签约概率*从签约到认购概率,这部分需求方没有到访工厂,直接签约并且之后认购,第三部分概率是从初始状态直接到认购的概率,这部分需求方跳过到访和签约的步骤,直接付款采购。在目前情况下,第一部分需求方占绝大多数,第二部分和第三部分的需求方很少。

步骤2、搭建多任务学习模型(multi-gate mixture-of-experts),同时训练、预测需求方的到访、签约和认购行为;在多任务学习模型的上游,使用三个专家网络,通过门(gate)融合三个专家网络的输出作为独有网络的输入。

步骤3、在多任务学习模型MMOE的基础上,额外设计聚合链路以降低正样本稀疏带来的训练困难,具体为:在三个专用网络分别输出ABC,将A和B的结果相乘得到的乘积作为任务B的输出,将A和B和C的乘积作为任务C的输出,即B任务的预测值result(B)=output(A)*output(B|A),C任务的预测值result(C)=result(B)*output(C|B),为保证这样条件概率的成立,将B任务的正样本调整为B或C,这样使得result(B)*output(C|B)一定能成立,简化问题。

步骤4、设计不同权重大小的损失函数。

步骤5、对模型的输入数据进行数据清洗和数据预处理。

步骤6、在训练阶段采用的样本包含到访、签约、认购的标签,以到访或签约或认购作为第一个专有网络的输出、以签约或认购作为第二个专有网络的输出、以认购作为第三个专有网络的输出;在在线阶段经使用第一个专有网络的输出,并将输出结果通过分段器从0-1的概率映射为1-10的打分。

本发明涉及一种实现上述方法的系统,包括:数据处理单元、模型单元和输出转换单元,其中:数据处理单元根据输入数据,将无效特征、唯一特征删除,将时间特征转化为对应的二元分类特征,将离散类数据特征经过独热编码和目标编码两种方式变为连续变量,再通过标准化将所有特征标准化到[0,1]的区间,得到标准数据;模型单元接收数据处理单元提交的标准数据,经过专家网络、门控网络、专有网络的处理后,输出三维特征;输出转换单元接收模型单元输出的三维特征,将第一维输出作为模型最终输出,利用分段器将0-1的概率转换为1-10的打分。

技术效果

本发明通过多任务学习模型结构中的联系通路,将其中的第一个任务的输出值经过与第二个网络的输出值逐项相乘后,得到的结果作为第二个任务的输出值,同样的第二个任务的输出值也会与第三个网络的输出值逐项相乘后作为第三个任务的输出值。另外给三个任务设置了不同的损失函数配比,在首任务上设置了比较高的比例,使得模型能够更加偏向于学习首任务。与现有技术相比,本发明在召回率指标上能比其他测试的模型高出5%左右,测试的模型包括逻辑回归、多层感知机和多门控混合专家网络。

附图说明

图1为需求方行为的序列化转化链路示意图;

图2为本研究问题与其他问题的区别示意图;

图3为MMOE模型结构图

图4为本发明模型结构示意图;

图5为本模型与旧模型在到访指标上的比较示意图;

图6为本模型与旧模型在签约指标上的比较示意图;

图7为本模型与旧模型在认购指标上的比较示意图。

具体实施方式

如图1所示,为本实施例涉及一种基于需求方与商品之间的关系模型的需求意向度预测方法,包括以下步骤:

第一步、对需求方采购意愿度及其行为进行建模:根据数据埋点的位置,对需求方的关键行为分为到访、签约、付款认购,通过多级转化链路递进地表示需求方采购物品意向度的大小。

所述的多级转化链路的最终付款概率为:p(b)=p(i2v)*p(v2c)*p(c2b)+p(i2v)*p(v2b)+p(i2b),其中:需求方初始状态为init,简写i,到访为visited,简写v,签约为contract,简写c,认购为buy,简写b,2代表to,比如i2v代表从初始状态转移到到访状态,p(i2v)代表转移的概率,下同。

第二步、构建模型结构:使用多任务学习模型(MMOE)同时学习三个输出指标的同时,新增三个专有网络输出的拼接,并且将到访的指标改为三个指标的或,即不将第一个网络定义为到访,是定义为到访或签约或认购这样的代表需求方意向度的指标。

如图4所示,所述的模型结构包括:数据处理单元,模型单元,输出转换单元。其中数据处理单元根据输入数据,将无效特征、唯一特征删除,将时间特征转化为对应的二元分类特征,将离散类数据特征经过独热编码和目标编码两种方式变为连续变量,再通过标准化将所有特征标准化到[0,1]的区间上,最终得到能够拿来训练或者预测的标准数据。而模型单元接收数据处理单元提交的标准数据,经过专家网络、门控网络、专有网络的处理后,输出为三维特征。最后的输出转换单元接收模型单元输出的三维特征,然后将第一维输出作为模型最终输出,利用分段器将0-1的概率转换为1-10的打分。

当输入数据是60维,在共享网络层使用3个专家网络,每个专家网络的结构是相同的,都是60*75*30单隐层的多层感知机(MLP)模型,将三个专家网络的30维输出经过门网络(gate)的线性组合后得到30维中间结果,然后输入三个独有网络中,独有网络的结构设计为30*45*2,最后的输出是2维结果,分别代表一个指标的正样本概率和负样本概率,两者之和为1,网络使用的损失函数是交叉熵函数,并且将三个子任务的损失函数的权重设的不等值,设为0.8,0.1,0.1.

本实施实例的模拟实验比较本模型和老模型在同一批数据上对到访、签约、认购这三个指标上的表现,并据此得到1-10分每个分段对某标签的正样本人数和比例。

如图5所示,为到访标签上的各个分段上本模型和老模型的效果对比图。图中主要比较各个分段上到访人数和到访的比例。可以看出,在到访人数上,本模型绝大多数到访数都集中在比较高的分数段,相比于老模型主要集中在中间分段效果会更好,即模型给出的高打分可以较好的体现需求方的高采购意向度。在到访比例上与老模型差不多,在10分处会有较大的优势。

如图6、7所示,为签约、认购标签上的各个分段上本模型和老模型的效果对比图。可以看出,在签约、认购的人数上,本模型可以给绝大多数达成采购的需求方赋予比较高的打分,能较好的召回高质量需求方,在高分段的召回比例上,本模型也比老模型有更高的转化率。

通过以上模拟实验的结果,设计的模型在高分段的召回数和召回比例上与现有的老模型相比确实拥有巨大的优势。

第一,利用后转化链路信息帮助前转化链路的指标进行训练学习,能有效提高前转化链路指标的预测稳定性和召回率,第二,充分利用大采购场景与其他线上场景如广告、推荐的区别,即大量的供应链下游人员,优化的目标在前转化链路,起到初筛把关的作用,第二,以三个输出指标作为训练标签,但最后输出一个指标作为总的意向度,方便训练和预测这两种对模型的使用方式。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号