首页> 中国专利> 一种基于客户浏览行为序列的信用卡产品推荐方法

一种基于客户浏览行为序列的信用卡产品推荐方法

摘要

本发明涉及一种基于客户浏览行为序列的信用卡产品推荐方法,包括:获取推荐所需处理数据,包括客户方数据和卡产品特性数据,并对客户方数据进行特征化处理,获取客户基本信息画像和客户方特征向量;根据卡产品特性数据和处理得到的特征化向量,以及银行信用卡中心待推荐的卡产品信息,分别通过xgboost模型、Item2Vec模型和产品特性相似度算法进行产品评分;对三种方法得到的产品评分进行加权融合,并对不同待推荐卡产品进行排序。与现有技术相比,本发明具有能够保证产品召回算法的时效性和精准度,解决冷启动问题等优点。

著录项

  • 公开/公告号CN113254775A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 上海浦东发展银行股份有限公司;

    申请/专利号CN202110625340.3

  • 发明设计人 张晓筱;

    申请日2021-06-04

  • 分类号G06F16/9535(20190101);G06F16/9536(20190101);G06Q30/06(20120101);G06Q40/02(20120101);

  • 代理机构31225 上海科盛知识产权代理有限公司;

  • 代理人林君如

  • 地址 200002 上海市黄浦区中山东一路12号

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本发明涉及计算机技术领域,尤其是涉及一种基于客户浏览行为序列的信用卡产品推荐方法。

背景技术

随着金融科技的快速发展,AI技术在金融机构特别是信用卡行业的研究范围持续扩大。其中如何实现持续客户增长的目标是较为重要的指标,这其中面临的最主要问题为:如何选择合适的AI技术赋能实现高效获客。数据价值挖掘和精准推荐、个性化推荐技术的助力正为该问题的解决提供解决方案。纵观市场上的推荐方法,分为经典推荐方法和基于深度神经网络的推荐方法两部分。

经典推荐方法技术包括关联规则、协同过滤算法。关联规则利用数据挖掘商品之间的关联关系,最为经典的例子即“尿布-啤酒理论”,即在超市的货架设计时,将尿布和啤酒两类商品放在相邻的货架上,可以提高两类商品的销售额。该理论的得出主要是基于实际超时的购买数据进行挖掘分析得出买了尿布的男性,大概率都会买啤酒。协同过滤算法包括基于用户的协同过滤、基于物品的协同过滤和基于内容的协同过滤算法,其核心原理即通过用户-物品-内容之间的关系数据,计算用户-用户、物品-物品、内容-内容的相似矩阵用于推荐排序。两类经典技术在商品量丰富、客户量相当的互联网电商行业以及线下零售是有高效应用的,然而应用在信用卡行业的产品推荐则效果较差。以基于物品的协同过滤举例,需要计算物品-物品相似矩阵,通过千万级的客户数,和百级的产品数构建的矩阵非常的稀疏,无法进行推荐排序。此外,传统协同过滤推荐算法应用于金融银行业卡产品推荐场景时,存在因数据稀疏导致产品或者用户之间的信息丢失、难以应对冷启动场景以及可扩展性不高的问题;且产品、物品之间的数据量不均衡导致召回率低。

基于深度神经网络的推荐方法中最为流行的为Google在2016年提出的wide&deep网络在推荐领域的应用,以及DeepFM等。然而这些常用的推荐算法在信用卡银行业的产品推荐场景中的效果较差,无法得到良好的适用。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于客户浏览行为序列的信用卡产品推荐方法。

本发明的目的可以通过以下技术方案来实现:

一种基于客户浏览行为序列的信用卡产品推荐方法,该方法具体包括如下步骤:

S1:获取推荐所需处理数据,包括客户方数据和卡产品特性数据,并对客户方数据进行特征化处理,获取客户基本信息画像和客户方特征向量;所述客户方数据包括客户的基本属性、客户在该银行信用卡APP的卡片点击行为数据、客户交易行为数据、客户设备APP列表数据以及客户客服对话数据,所述卡产品特性数据为基于银行信用卡中心的卡产品图片资源服务器调取的该客户已办理的第一张信用卡的卡产品信息。

所述客户基本信息画像为客户的基本属性;所述客户方特征向量包括客户消费分类偏好向量和客户APP分类偏好向量;所述客户消费分类偏好向量为对客户近六个月的消费记录按照不同消费类型进行聚合统计所构建的偏好向量,各消费记录数据分别标注有消费分类标签,统计后的偏好向量进行停用词、无效符号清晰后生成含有商户名和消费类型标签的数据集。

所述客户APP分类偏好向量为基于客户在银行信用卡APP的点击行为、客户智能手机APP的安装列表清单和客户客服对话数据所构建的偏好向量,基于获取的三项数据,为待推荐的银行信用卡中心所有二卡进行相关APP分类偏好的打分,最终通过one-hot后再融合构建客户APP分类偏好向量。

S2:根据卡产品特性数据和处理得到的特征化向量,以及银行信用卡中心待推荐的卡产品信息,分别通过xgboost模型、Item2Vec模型和产品特性相似度算法进行产品评分;具体地:

基于客户的基本属性利用xgboost算法进行打分,得到xgboost模型得分。

通过产品特性相似度算法进行产品评分的具体内容为:

采用ImageSimResult算法对客户已有的第一张信用卡产品的版面图片与待推荐办理的二卡的各信用卡产品的版面图片依次分别进行相似度计算,获取图片相似度后,将其与获取的客户消费分类偏好向量进行融合,获取综合相似度评分。

进一步地,采用明汉距离进行图片之间的相似计算。

通过Item2Vec模型进行产品评分的具体内容为:

采用Item2Vec融合Embbiding的深度神经网络思路进行实时的卡产品词向量的训练,基于从银行信用卡APP上获取的产品浏览行为序列特征行为数据集,即将客户在银行信用卡APP一天内点击卡产品的行为序列作为正例,将历史曝光但未被客户点击的卡产品信息作为负例,得到每个卡产品的评分。

本发明通过tem2Vec融合Embbiding的深度神经网络,结合待推荐产品池的卡产品向量进行笛卡尔积计算,实现卡产品的召回。

S3:对三种方法得到的产品评分进行加权融合,并对不同待推荐卡产品进行排序。

本发明提供的基于客户浏览行为序列的信用卡产品推荐方法,相较于现有技术至少包括如下有益效果:

1)本发明充分挖掘行业客户行为特性,利用客户的浏览、点击行为序列,融合Embedding的深度神经网络思路,进行实时的词向量训练,能够保证产品召回算法的时效性和精准度。

2)基于客户的基本属性、卡产品的分类属性和客户的消费分类属性,能够实现更加准确、高效的推荐的同时,基于用户消费兴趣的协同过滤推荐,引入客户消费数据,通过构建客户兴趣向量和物品属性向量,进行内积计算商品推荐权重,解决了常见的冷启动问题。

3)本发明采用了多模型加权融合进行线性加权融合排序,不局限于单一算法,将利用机器学习xgboost评分模型、传统基于产品属性相似度评分模型和核心的基于Embedding的Item2Vec评分模型进行了高效融合排序,避免了因数据稀疏导致产品或者用户之间的信息丢失,且有利于在信用卡银行业的产品推荐场景实现良好应用。

附图说明

图1为本发明基于客户浏览行为序列的信用卡产品推荐方法的流程示意图;

图2为实施例中构建客户APP分类偏好向量的融合原理示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

为便于本领域技术人员更好地理解本申请,下面先对本申请涉及的技术用语进行简单介绍。

1、信用卡卡库,为由各个银行维护的用于存储各个银行对外发布的各个信用卡的信用卡特征信息的数据库,信用卡卡库中的各个信用卡按照入库时间配置序号,本申请中,信用卡卡库可以由各家银行周期性或者触发性地进行更新,例如,信用卡产品下架更新、上新更新等;信用卡库中包括多种信息服务器,包括卡产品图片资源服务器等。

2、信用卡特征信息,为用于描述信用卡特征的信息,包括但不限于:信用卡授信额度、信用卡权益、信用卡费用、信用卡外观等,本申请中,信用卡特征信息还可以包括:信用卡版面图片特征等。

3、信用卡授信额度,为根据信用卡等级确定的可申请额度范围。例如:信用卡类型可分别为普卡、VIP卡、亲子卡、白金卡、黑卡等,对应的,信用卡授信额度也不同。

4、信用卡产品客户端,为安装在手机、计算机、个人数字助理(PersonalDigitalAssistant,PDA)等终端设备上,可以为用户推荐信用卡,并且可以对用户绑定的各个信用卡进行还款管理的一种前端应用程序,在后文中将以银行信用卡APP简称。

5、信用卡产品平台,为对信用卡产品客户端的用户进行管理,并为信用卡产品客户端提供数据库服务、信用卡推荐服务等各类服务的后台运行平台。

本发明涉及一种基于客户浏览行为序列的信用卡产品推荐方法,用于某银行信用卡中心的信用卡产品平台对该行客户进行信用卡的二卡产品推荐。该方法基于客户浏览行为序列,首先将用户侧的浏览行为序列转化成Item组成的句子,参照word2vec训练词向量的思路将商品向量化,将高维稀疏的表示方式映射到低维稠密的向量空间中,进而捕捉不同商品间的相似性。另外,基于用户消费兴趣的协同过滤推荐,引入客户消费数据,通过构建客户兴趣向量和物品属性向量,进行内积计算商品推荐权重,以解决“冷启动”问题。

具体地,本发明首先获取推荐所需处理数据,并对不同数据转换为特征化向量,即基于客户的基本信息数据、客户的卡片点击行为数据、客户交易行为数据、客户设备APP列表数据、客户客服对话数据和卡产品特性数据,构建以客户为中心的客户基本信息画像、客户消费分类偏好向量、客户APP分类偏好向量以及以产品为中心的产品序列训练数据集和卡产品特性画像。其中:

客户基本信息画像包括客户的基本属性:如年龄、星座、性别、学历、行内授信额度、他行授信额度、帐龄和职务,帐龄从该客户办理的第一张本银行信用卡产品起到结清之日(或帐龄分析的截止日)止的时间期限。

客户消费分类偏好向量:对客户近6个月的消费记录按照不同的多个消费类型进行聚合统计,如美食、酒店、早教等。然后构建偏好向量。本发明对于消费记录数据分别标注消费分类标签,并基于互联网爬取的商户名和商户分类数据,对不同的消费数据进行停用词、无效符号等清洗,最终形成大量的含有商户名和消费类型标签的数据集。最后,通过构建基于TextCNN的文本分类模型进行消费分类预测,利用文本分类技术进行预测的方法为现有技术,在此不过多赘述。

客户APP分类偏好向量:构建主要基于客户在本银行信用卡APP的点击行为、客户智能手机APP的安装列表清单和客户客服对话数据的偏好向量。具体地,1、获取客户在本银行信用卡APP上近6个月是否有点击浏览本银行其他信用卡产品,获取产品浏览行为序列,行为序列内容包括点击的卡产品类型、浏览卡产品的次数。2、获取客户智能手机中各银行信用卡APP的安装列表排布,并对这些APP提取相对应的卡产品类型,计算这些卡产品类型的权重。3、基于客户微信公众号对话数据提取卡产品类型的关键字描述信息,包括文本信息或语音信息,若为语音信息,则通过文字转换为文本格式。基于上述提取的三项信息,为待推荐的本银行信用卡中心所有二卡进行相关APP分类偏好的打分,最终通过one-hot后再融合构建客户APP分类偏好向量。具体地,通过构建APP行为向量、APPList安装偏好向量和微信对话偏好向量;三个向量的维度都为1*(m+1),m表示待推荐的卡产品的个数,1表示客户证件号;特征构建均采用相似分类的方式进行加权。相关原理图如图2所示。打分后设定权重如下,融合结果=sum(向量*权重):

df_appbehavior_alpha,1(APP行为向量权重)

df_applist_alpha,1(APPList安装偏好向量权重)

df_weixin_alpha,3(微信对话偏好向量权重)。

卡产品特性画像:基于本银行信用卡中心的卡产品图片资源服务器调取该用户已办理的第一张信用卡的卡产品信息,并对已有卡产品信息获取该卡产品的类型,将该类型信息生成卡产品特性数据。

获取客户的相关数据和卡产品特性数据后,基于离线模型进行卡产品推荐。本发明方法通过基于客户基本属性的xgboost方法、基于行为序列的item2vec方法和基于产品特性的相似度评分算法进行加权融合,实现排序。

其中,基于客户的基本属性(客户基本信息画像),利用xgboost算法进行打分,作为xgboost模型得分。xgboost算法是现有技术常用的方法,在此不过多赘述。

基于产品特性的相似度评分算法采用ImageSimResult(图片相似度融合算法)对客户已有的第一张信用卡产品的版面图片与可推荐办理二卡的各信用卡产品的版面图片依次分别进行相似度计算,同时结合图片风格分类等进行融合评分,得到综合相似度评分。各类型的卡片为固定,即一张卡产品对应一张图片,各卡产品的版面图片存储在本银行信用卡中心的图片资源服务器,上述图片可通过Http协议接口从图片资源服务器获取,作为通过和imageSimResult离线计算的特征。作为优先方案,本发明采用明汉距离进行图片之间的相似计算,主要通过对每一张图片生成“图片指纹”字符串,然后进行指纹比较,越接近,越相似;其中,涉及到图片的操作包括:将图片转换成灰度图、缩小成32X32缩略图、获取灰度像素组、计算平均像素颜色值,通过计算两组缩略图的平均像素比较数组对应的每一位的值,相等则为1,否则为0,统计比较和,得到最终的明汉距离值。获取明汉距离值后,将其与获取的客户消费分类偏好向量进行融合,获取综合相似度评分。具体地,基于明汉距离计算客户已持卡片和待推荐卡片的相似度构建相似矩阵,同时结合客户消费分类偏好向量进行相乘,得出产品相似矩阵分数。

Item2Vect是现有技术,本发明将该技术应用于信息推荐领域,得到了更加准确的改进推荐方法。Item2Vec采用融合Embbiding的深度神经网络思路进行实时的卡产品词向量的训练,构建的数据集是从本银行信用卡APP上产品浏览行为序列特征行为数据集。具体的数据样本选择为:将客户在本银行信用卡APP一天内点击卡产品的行为序列为正例,负例为历史曝光但未被客户点击的卡产品,具体地,把客户浏览的卡产品集合等价于word2vec中的word的序列,即句子,出现在同一个集合的卡产品对视为正列,最终利用SGD方法学习的目标函数max,得到每个卡产品的embedding representation,将其编码后得到分数,并对每个卡产品得到的分数进行排序。相比于单一的相似推荐算法,本发明采用Item2Vec技术对基于类别的相似推荐进行了补充,探索出了新的相似性的表示方式。

进一步地,本发明主要通过Embedding(即上方提到的Item2Vec算法)结合待推荐产品池的卡产品向量的笛卡尔积计算,实现卡产品的召回。向量相似计算为现有技术的应用,在此不过多赘述。

通过基于客户基本属性的xgboost方法、基于行为序列的item2vec方法和基于产品特性的相似度评分算法各自获取到相对应的分数后,采用多模型加权融合评分计算最终综合评分的方式将分数由高到低进行排序,融合权重是基于训练调参得出。即在Item2Vec训练时,优先采用客户近1个月以及近3个月的在本银行信用卡APP中的卡产品浏览点击序列为正样本(分别为3.8W、10W),选择已经上线的半年的二卡办理页面的二卡推荐模型的调用数据为负样本(4W+),最终通过最大似然估计的思想,使用对数损失函数,使得正样本出现的概率尽可能得大。训练的vectorSize=5时,效果最佳。

以下为本实施例给出的优选的融合规则,实际采用本发明方法时,可根据实际情况设定三种分数的权重。

结合xgboost、相似度计算和item2vec模型所使用的特征和适用场景,优先设定了如下融合规则,综合设计了3个场景进行权重的调整,输出融合模型。

最后,在排序后的产品的基础上,结合业务限定规则策略进行调整再排排序,实现精排,输出topK个推荐产品。具体地,基于实际业务限定的产品发布时间优先,重复产品不推荐,当下热推产品优先等限定策略,进行精排。基于精排的结果对客户进行信用卡产品推荐。

本发明充分挖掘行业客户行为特性,利用客户的浏览、点击行为序列,融合Embedding的深度神经网络思路,进行实时的词向量训练,能够保证产品召回算法的时效性和精准度。基于客户的基本属性、卡产品的分类属性和客户的消费分类属性,能够实现更加准确、高效的推荐的同时,通过构建客户兴趣向量和物品属性向量,进行内积计算商品推荐权重,解决了常见的冷启动问题。本发明采用了多模型加权融合进行线性加权融合排序,不局限于单一算法,将利用机器学习xgboost评分模型、传统基于产品属性相似度评分模型和核心的基于Embedding的Item2Vec评分模型进行了高效融合排序,避免了因数据稀疏导致产品或者用户之间的信息丢失,且有利于在信用卡银行业的产品推荐场景实现良好应用。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号