首页> 中国专利> 一种基于决策树的产品推荐方法及装置

一种基于决策树的产品推荐方法及装置

摘要

本申请公开了一种基于决策树的产品推荐方法及装置,获取待测客户的特征,针对每种产品,将特征输入至与产品对应的决策树中,得到每种产品的客户风险承受等级,其中,决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建,客户风险承受等级越高,则待测客户的风险承受能力越强。将客户风险承受等级大于预设等级的产品,作为推荐给待测客户的产品。利用本申请所述的方法,基于预先构建的决策树,可以准确评估每种产品的客户风险承受等级,依据客户风险承受等级向待测客户推荐产品,能够确保推荐给待测客户的产品能够满足其自身风险承受能力。

著录项

  • 公开/公告号CN113052689A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 中国银行股份有限公司;

    申请/专利号CN202110486328.9

  • 发明设计人 胡传杰;王瑞瑞;陈小乐;

    申请日2021-04-30

  • 分类号G06Q40/02(20120101);G06Q40/06(20120101);G06Q30/00(20120101);G06Q30/06(20120101);G06K9/62(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人周初冬

  • 地址 100818 北京市西城区复兴门内大街1号

  • 入库时间 2023-06-19 11:39:06

说明书

技术领域

本申请涉及机器学习技术领域,尤其涉及一种基于决策树的产品推荐方法及装置。

背景技术

客户在购买银行推荐的产品之后,受限于客户自身因素的影响,客户可能无法承受购买该产品所带来的风险,从而引发不可预估的后果,给银行和客户带来巨大的负面影响。

为此,如何向客户推荐满足其自身风险承受能力的产品,成为本领域亟需解决的问题。

发明内容

本申请提供了一种基于决策树的产品推荐方法及装置,目的在于向客户推荐满足其自身风险承受能力的产品。

为了实现上述目的,本申请提供了以下技术方案:

一种基于决策树的产品推荐方法,包括:

获取待测客户的特征;

针对每种产品,将所述特征输入至与所述产品对应的决策树中,得到每种所述产品的客户风险承受等级;其中,所述决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建;所述客户风险承受等级越高,则所述待测客户的风险承受能力越强;

将所述客户风险承受等级大于预设等级的产品,作为推荐给所述待测客户的产品。

可选的,所述决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建,包括:

获取所述产品的样本客户信息;

对所述样本客户信息进行解析,得到样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系;其中,所述特征占比表征具备所述特征的样本客户的总数在样本总数中所占的比重;

基于所述对应关系,构建训练数据集;

基于所述训练数据集,计算所述特征的信息增益;

基于各个所述特征的信息增益,构建决策树。

可选的,所述基于所述对应关系,构建训练数据集,包括:

按照对应的特征占比从大到小的顺序,对各个所述特征进行排序,得到特征序列;

选取所述特征序列中的前m位特征,作为目标特征;

基于所述客户风险承受等级、所述目标特征、以及所述特征占比之间的对应关系,构建训练数据集。

可选的,所述基于所述训练数据集,计算所述特征的信息增益,包括:

利用与所述目标特征对应的特征占比,计算所述客户风险承受等级的信息熵;

利用所述信息熵和预设的条件熵,计算所述目标特征的信息增益。

可选的,所述基于各个所述特征的信息增益,构建决策树,包括:

按照所述信息增益从大到小的顺序,对各个所述目标特征进行排序,生成决策树。

可选的,所述获取待测客户的特征,包括:

利用人脸识别算法,对所述待测客户进行身份验证;

在待测客户通过身份验证的情况下,获取所述待测客户的特征。

可选的,所述将所述客户风险承受等级大于预设等级的产品,作为推荐给所述待测客户的产品,包括:

将所述待测客户已购买过的产品,标识为目标产品;

将所述客户风险承受等级大于预设等级的产品,标识为第一产品;

计算所述第一产品与所述目标产品之间的相似度;

在所述第一产品与所述产品之间的相似度大于预设阈值的情况下,将所述第一产品作为推荐给所述待测客户的产品。

一种基于决策树的产品推荐装置,包括:

获取单元,用于获取待测客户的特征;

评估单元,用于针对每种产品,将所述特征输入至与所述产品对应的决策树中,得到每种所述产品的客户风险承受等级;其中,所述决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建;所述客户风险承受等级越高,则所述待测客户的风险承受能力越强;

推荐单元,用于将所述客户风险承受等级大于预设等级的产品,作为推荐给所述待测客户的产品。

一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行所述的基于决策树的产品推荐方法。

一种基于决策树的产品推荐设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;

所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序运行时执行所述的基于决策树的产品推荐方法。

本申请提供的技术方案,获取待测客户的特征,针对每种产品,将特征输入至与产品对应的决策树中,得到每种产品的客户风险承受等级,其中,决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建,客户风险承受等级越高,则待测客户的风险承受能力越强。将客户风险承受等级大于预设等级的产品,作为推荐给待测客户的产品。利用本申请所述的方法,基于预先构建的决策树,可以准确评估每种产品的客户风险承受等级,依据客户风险承受等级向待测客户推荐产品,能够确保推荐给待测客户的产品能够满足其自身风险承受能力。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于决策树的产品推荐方法的示意图;

图2为本申请实施例提供的另一种基于决策树的产品推荐方法的示意图;

图3为本申请实施例提供的一种基于决策树的产品推荐装置的架构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,为本申请实施例提供的一种基于决策树的产品推荐方法的示意图,包括如下步骤:

S101:预先获取不同种类产品的样本客户信息。

其中,所谓的产品,针对金融领域来说,包括但不限于为:基金、股票、以及债券等。

S102:针对每种产品,对样本客户信息进行解析,得到样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系。

其中,所谓的客户风险承受等级,表征样本客户的风险承受能力,客户风险承受等级越高,则样本客户的风险承受能力越强。

所谓的特征,即样本客户的特征,例如,购买基金的样本客户中所具备的特征包括:年净收入在15万元以上、年龄在20~25岁、有两年以上的基金购买经验、以及无不良证信记录等。

所谓的特征占比,表征具备特征的样本客户的总数在样本总数中所占的比重,具体的,假设购买基金的样本总数为100,具备年净收入在15万元以上的特征的样本客户的总数为60(则对应的特征占比为60%),具备年龄在20~25岁的特征的样本客户的总数为45(则对应的特征占比为45%),具备有两年以上的基金购买经验的特征的样本客户的总数为30(则对应的特征占比为30%),具备无不良征信记录的特征的样本客户的总数为95(则对应的特征占比为95%)。

S103:按照对应的特征占比从大到小的顺序,对各个特征进行排序,得到特征序列。

S104:选取特征序列中的前m位特征,作为目标特征。

其中,m为正整数。

S105:基于客户风险承受等级、目标特征、以及特征占比之间的对应关系,构建训练数据集。

其中,训练数据集包括目标特征、与目标特征对应的特征占比、以及客户风险承受等级。

S106:利用与目标特征对应的特征占比,计算客户风险承受等级的信息熵。

其中,利用与目标特征对应的特征占比,计算客户风险承受等级的信息熵的具体过程,如公式(1)所示。

在公式(1)中,H(D)代表信息熵,D代表训练数据集,p

S107:利用信息熵和预设的条件熵,计算目标特征的信息增益。

其中,利用信息熵和预设的条件熵,计算目标特征的信息增益的具体过程,如公式(2)所示。

g(D,A)=H(D)-H(D|A) (2)

在公式(2)中,g(D,A)代表信息增益,H(D|A)代表条件熵。

所谓的条件熵H(D|A),如公式(3)所示。

S108:按照信息增益从大到小的顺序,对各个目标特征进行排序,生成决策树。

S109:利用人脸识别算法,对待测客户进行身份验证。

S110:在待测客户通过身份验证的情况下,获取待测客户的特征、以及待测客户已购买过的产品,并将待测客户已购买过的产品,标识为目标产品。

S111:针对每种产品,将待测客户的特征输入至与产品对应的决策树中,得到每种产品的客户风险承受等级。

S112:将客户风险承受等级大于预设等级的产品,标识为第一产品。

S113:计算第一产品与目标产品之间的相似度。

其中,计算第一产品与目标产品之间的相似度的具体实现方式,为本领域技术人员所熟悉的公知常识,这里不再赘述。

S114:在第一产品与目标产品之间的相似度大于预设阈值的情况下,将第一产品作为推荐给待测客户的产品。

综上所述,利用本实施例所述的方法,基于预先构建的决策树,可以准确评估每种产品的客户风险承受等级,依据客户风险承受等级向待测客户推荐产品,能够确保推荐给待测客户的产品能够满足其自身风险承受能力。

需要说明的是,上述实施例提及的S101,为本申请所述基于决策树的产品推荐方法的一种可选的具体实现方式。此外,上述实施例提及的S102,也为本申请所述基于决策树的产品推荐方法的一种可选的具体实现方式。为此,上述实施例提及的流程,可以概括为图2所示的方法。

如图2所示,为本申请实施例提供的另一种基于决策树的产品推荐方法的示意图,包括如下步骤:

S201:获取待测客户的特征。

S202:针对每种产品,将特征输入至与产品对应的决策树中,得到每种产品的客户风险承受等级。

其中,决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建,客户风险承受等级越高,则待测客户的风险承受能力越强。

S203:将客户风险承受等级大于预设等级的产品,作为推荐给待测客户的产品。

综上所述,利用本实施例所述的方法,基于预先构建的决策树,可以准确评估每种产品的客户风险承受等级,依据客户风险承受等级向待测客户推荐产品,能够确保推荐给待测客户的产品能够满足其自身风险承受能力。

与上述本申请实施例提供的基于决策树的产品推荐方法相对应,本申请实施例还提供了一种基于决策树的产品推荐装置。

如图3所示,为本申请实施例提供的一种基于决策树的产品推荐装置的架构示意图,包括:

获取单元100,用于获取待测客户的特征。

其中,获取单元100具体用于:利用人脸识别算法,对待测客户进行身份验证;在待测客户通过身份验证的情况下,获取待测客户的特征。

评估单元200,用于针对每种产品,将特征输入至与产品对应的决策树中,得到每种产品的客户风险承受等级;其中,决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建;客户风险承受等级越高,则待测客户的风险承受能力越强。

其中,评估单元200具体用于:获取产品的样本客户信息;对样本客户信息进行解析,得到样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系;其中,特征占比表征具备特征的样本客户的总数在样本总数中所占的比重;基于对应关系,构建训练数据集;基于训练数据集,计算特征的信息增益;基于各个特征的信息增益,构建决策树。

评估单元200用于基于对应关系,构建训练数据集的过程包括:按照对应的特征占比从大到小的顺序,对各个特征进行排序,得到特征序列;选取特征序列中的前m位特征,作为目标特征;基于客户风险承受等级、目标特征、以及特征占比之间的对应关系,构建训练数据集。

评估单元200用于基于训练数据集,计算特征的信息增益的过程包括:利用与目标特征对应的特征占比,计算客户风险承受等级的信息熵;利用信息熵和预设的条件熵,计算目标特征的信息增益。

评估单元200用于基于各个特征的信息增益,构建决策树的过程包括:按照信息增益从大到小的顺序,对各个目标特征进行排序,生成决策树。

推荐单元300,用于将客户风险承受等级大于预设等级的产品,作为推荐给待测客户的产品。

其中,推荐单元300具体用于:将待测客户已购买过的产品,标识为目标产品;将客户风险承受等级大于预设等级的产品,标识为第一产品;计算第一产品与目标产品之间的相似度;在第一产品与产品之间的相似度大于预设阈值的情况下,将第一产品作为推荐给待测客户的产品。

综上所述,利用本实施例所述的方法,基于预先构建的决策树,可以准确评估每种产品的客户风险承受等级,依据客户风险承受等级向待测客户推荐产品,能够确保推荐给待测客户的产品能够满足其自身风险承受能力。

本申请还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本申请提供的基于决策树的产品推荐方法。

本申请还提供了一种基于决策树的产品推荐设备,包括:处理器、存储器和总线。处理器与存储器通过总线连接,存储器用于存储程序,处理器用于运行程序,其中,程序运行时执行上述本申请提供的基于决策树的产品推荐方法,包括如下步骤:

获取待测客户的特征;

针对每种产品,将所述特征输入至与所述产品对应的决策树中,得到每种所述产品的客户风险承受等级;其中,所述决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建;所述客户风险承受等级越高,则所述待测客户的风险承受能力越强;

将所述客户风险承受等级大于预设等级的产品,作为推荐给所述待测客户的产品。

可选的,所述决策树基于样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系预先构建,包括:

获取所述产品的样本客户信息;

对所述样本客户信息进行解析,得到样本客户的客户风险承受等级、特征、以及特征占比之间的对应关系;其中,所述特征占比表征具备所述特征的样本客户的总数在样本总数中所占的比重;

基于所述对应关系,构建训练数据集;

基于所述训练数据集,计算所述特征的信息增益;

基于各个所述特征的信息增益,构建决策树。

可选的,所述基于所述对应关系,构建训练数据集,包括:

按照对应的特征占比从大到小的顺序,对各个所述特征进行排序,得到特征序列;

选取所述特征序列中的前m位特征,作为目标特征;

基于所述客户风险承受等级、所述目标特征、以及所述特征占比之间的对应关系,构建训练数据集。

可选的,所述基于所述训练数据集,计算所述特征的信息增益,包括:

利用与所述目标特征对应的特征占比,计算所述客户风险承受等级的信息熵;

利用所述信息熵和预设的条件熵,计算所述目标特征的信息增益。

可选的,所述基于各个所述特征的信息增益,构建决策树,包括:

按照所述信息增益从大到小的顺序,对各个所述目标特征进行排序,生成决策树。

可选的,所述获取待测客户的特征,包括:

利用人脸识别算法,对所述待测客户进行身份验证;

在待测客户通过身份验证的情况下,获取所述待测客户的特征。

可选的,所述将所述客户风险承受等级大于预设等级的产品,作为推荐给所述待测客户的产品,包括:

将所述待测客户已购买过的产品,标识为目标产品;

将所述客户风险承受等级大于预设等级的产品,标识为第一产品;

计算所述第一产品与所述目标产品之间的相似度;

在所述第一产品与所述产品之间的相似度大于预设阈值的情况下,将所述第一产品作为推荐给所述待测客户的产品。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号