首页> 中国专利> 基于人工智能决策树的营销方法和装置

基于人工智能决策树的营销方法和装置

摘要

本发明涉及一种基于人工智能决策树的营销方法及装置,方法包括:获取训练样本数据,训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据,其包括:当前账户余额数据、年均账户余额数据、账户余额平均增长率数据、账户活跃度数据、企业经营年限数据、纳税信用等级数据、纳税额平均增长率数据,客户类别,其为重要价值客户、重要挽留客户、重要发展客户、低价值客户中的一种;基于训练样本数据,通过训练得到决策树客户类别预测模型;获取目标用户特征数据;根据目标用户特征数据得到目标用户所属的客户类别;显示目标用户所属的客户类别,以方便客户经理制定对应的线下营销计划,或者,营销该客户类别对应的产品。

著录项

  • 公开/公告号CN112184292A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利号CN202010974475.6

  • 发明设计人 尹腾召;张磊;

    申请日2020-09-16

  • 分类号G06Q30/02(20120101);G06K9/62(20060101);

  • 代理机构13129 石家庄德皓专利代理事务所(普通合伙);

  • 代理人刘磊娜

  • 地址 050000 河北省石家庄市桥西区自强路39号

  • 入库时间 2023-06-19 09:26:02

说明书

技术领域

本发明涉及计算机技术领域,尤其是涉及一种基于人工智能决策树的营销方法和装置。

背景技术

随着大数据技术的飞速发展,银行拥有的庞大数据和互联网上的海量数据成为了亟待开采的宝藏。与此同时,用户营销对数据的准确性有着较高的要求,高质量的客户数据可以极大提高营销成功率。

当前,银行业信贷部门对目标客户的挖掘主要采用“大水漫灌”的方式,即通过对银行用户数据和外部数据的简单筛选、校对、拼接,形成质量粗糙、数据量庞大的营销白名单,然后客户经理再对名单中的用户逐个推销所有的商品,这种方式无法针对不同的用户定制个性化数据,用户群体针对性不强,营销成功率较低。

发明内容

本发明的目的在于提供一种基于人工智能决策树的营销方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明所采取的技术方案是:

一方面,提供了一种基于人工智能决策树的营销方法,所述方法包括:

获取训练样本数据,所述训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别,所述潜在用户特征数据包括:潜在用户的当前账户余额数据、年均账户余额数据、账户余额平均增长率数据、账户活跃度数据、企业经营年限数据、纳税信用等级数据、纳税额平均增长率数据,潜在用户所属的客户类别为重要价值客户、重要挽留客户、重要发展客户、低价值客户中的一种;

基于所述训练样本数据,通过训练得到人工智能决策树客户类别预测模型;

获取目标用户特征数据;

将所述目标用户特征数据作为所述客户类别预测模型的输入,输出所述目标用户所属的客户类别;

显示所述目标用户所属的客户类别,以方便客户经理根据所述客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。

作为本发明的进一步改进,所述获取训练样本数据之前,所述方法还包括:

采集原始样本数据,所述原始样本数据包括多个初始用户特征数据;

对原始样本数据进行预处理得到营销白名单,所述营销白名单包括多个潜在用户特征数据;

确定所述营销白名单中的每个潜在用户所属的客户类别。

作为本发明的进一步改进,所述采集原始样本数据包括:

获取总行下发的第一部分初始用户特征数据,所述第一部分初始用户特征数据包括:社会信用代码、当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、纳税额平均增长率;

获取外部数据库中的第二部分初始用户特征数据,所述第二部分初始用户特征数据包括:社会信用代码、纳税信用等级;

获取开源数据库中的第三部分初始用户特征数据,所述第三部分初始用户特征数据包括:社会信用代码、企业经营年限、企业经营状态;

基于所述社会信用代码进行数据匹配,生成用户信息基础表,所述用户信息基础表包括多个初始用户特征数据。

作为本发明的进一步改进,所述对原始样本数据进行预处理得到营销白名单包括:

对原始样本数据进行数据清洗,所述数据清洗包括以下至少一项处理操作:缺失值处理、异常值处理、离散化处理、归一化处理、去重处理、合并同类项处理;

剔除原始样本数据中不满足业务要求的初始用户特征数据生成所述营销白名单,所述业务要求包括:企业经营年限、企业经营状态、纳税信用等级。

作为本发明的进一步改进,所述确定所述营销白名单中的每个潜在用户所属的客户类别包括:

针对每一个潜在用户,在接收到类别指令时,按照所述类别指令确定所述潜在用户所属的客户类别,所述类别指令携带客户类别信息。

作为本发明的进一步改进,所述基于所述训练样本数据,通过训练得到人工智能决策树客户类别预测模型包括:

根据训练样本获取数据集和属性集,所述数据集包括多个潜在用户样本数据,所述属性集包括当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、企业经营年限、纳税信用等级、纳税额平均增长率7个属性;

将当前层的上一层中的叶节点包含的样本数据作为当前层的根节点,计算所述根节点的信息熵;

将属性集中的每种属性依次作为分类指标,以将所述根节点划分为多个叶节点,计算每个叶节点的信息熵;

基于所述信息熵以及每个所述叶节点的信息熵,计算每种属性的信息增益,将信息增益数值最大的属性作为当前层的最优划分属性,基于所述最优划分属性将所述根节点划分为多个叶节点。

作为本发明的进一步改进,所述计算所述根节点的信息熵,包括:

采用以下公式计算当前层根节点的信息熵:

P

其中,Ent(D

作为本发明的进一步改进,所述将属性集中的每种属性依次作为分类指标,以将所述根节点划分为多个叶节点,计算每个叶节点的信息熵,包括:

获取作为分类指标的属性,将当前层根节点按照预定划分规则划分为多组,将每组的样本数据作为一个叶节点,采用以下公式计算叶节点的信息熵:

P

其中,Ent(D

作为本发明的进一步改进,所述基于所述信息熵以及每个所述叶节点的信息熵,计算每种属性的信息增益,将信息增益数值最大的属性作为当前层的最优划分属性,基于所述最优划分属性将所述根节点划分为多个叶节点,包括:

采用以下公式计算每种属性的信息增益:

其中,Gain(D,a)表示数据集D中属性k的信息增益,V表示以a属性作为分类指标时划分的组数,|D|表示数据集D中的数据数量,|D

按照所述最优划分属性对应的划分规则将所述根节点划分为多个叶节点。

另一方面,提供了一种基于人工智能决策树的营销装置,所述装置包括:

训练样本数据获取模块,其用于获取训练样本数据,所述训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别,所述潜在用户特征数据包括:潜在用户的当前账户余额数据、年均账户余额数据、账户余额平均增长率数据、账户活跃度数据、企业经营年限数据、纳税信用等级数据、纳税额平均增长率数据,潜在用户所属的客户类别为重要价值客户、重要挽留客户、重要发展客户、低价值客户中的一种;

预测模型生成模块,其用于基于所述训练样本数据,通过训练得到人工智能决策树客户类别预测模型;

特征数据获取模块,其用于获取目标用户特征数据;

输入模块,其用于将所述目标用户特征数据作为所述客户类别预测模型的输入,输出所述目标用户所属的客户类别;

显示模块,其用于显示所述目标用户所属的客户类别,以方便客户经理根据所述客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。

采用上述技术方案所产生的有益效果在于:

本发明实施例提供的基于人工智能决策树的营销方法及装置,通过获取训练样本数据,训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别;基于训练样本数据,通过训练得到人工智能决策树客户类别预测模型;获取目标用户特征数据;将目标用户特征数据作为客户类别预测模型的输入,输出目标用户所属的客户类别;显示目标用户所属的客户类别,以方便客户经理根据客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。本发明根据多个用户的特征数据以及客户类别建立人工智能决策树客户类别预测模型,并基于该人工智能决策树客户类别预测模型能够快速得到每个用户的类型,进而方便针对每个用户实行不同的营销计划、以及营销不同的产品,实现了针对不同的用户定制个性化数据,用户群体针对性强,提高了营销成功率。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种基于人工智能决策树的营销方法的流程图。

图2是本发明实施例提供的一种人工智能决策树客户类别预测模型的示意图。

图3是本发明实施例提供的一种基于人工智能决策树的营销装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合具体实施例对发明进行清楚、完整的描述,需要理解的是,术语“中心”、“竖向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

图1是本发明实施例提供的一种基于人工智能决策树的营销方法的流程图,该方法的执行主体可以为银行信贷部门所使用的服务器,如图1所示,方法包括:

S101、获取训练样本数据。

训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别,潜在用户特征数据包括:潜在用户的社会信用代码、企业经营年限、企业经营状态、纳税信用等级,潜在用户所属的客户类别为重要价值客户、重要挽留客户、重要发展客户、低价值客户中的一种。

其中,获取训练样本数据之前,还包括以下步骤:

S1011、采集原始样本数据,原始样本数据包括多个初始用户特征数据。

采集原始样本数据的方式包括但不限于以下步骤:

1、获取总行下发的第一部分初始用户特征数据,第一部分初始用户特征数据包括:社会信用代码、当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、纳税额平均增长率;

其中,获取后的第一部分初始用户特征数据可以存储在本地数据库中,可通过人工在数据交换平台搜索相关用户的第一部分初始用户特征数据,并在搜索到该数据后存储在本地数据库中;或者,可以预先向总行申请相关用户的第一部分初始用户特征数据,并在总行在发送第一部分初始用户特征数据后存储在本地数据库中。

另外,总行可以按照预定的时间间隔多次发送第一部分初始用户特征数据,则服务器每次在接收到该第一部分初始用户特征数据后实时更新本地数据库。

2、获取外部数据库中的第二部分初始用户特征数据,第二部分初始用户特征数据包括:社会信用代码、纳税信用等级;

外部数据库指代的是工商局、税务局中的数据库,在获取到第二部分初始用户特征数据后,也可以存储在本地数据库中。

在一种可能的实现方式中,用户可以登陆银税服务大厅、该行门户网站跳转、该行企业网银跳转中任一入口后,通过该行企业网银或企业掌银勾选《涉税信息授权书》,授权该行使用其税务信息,从而服务器可以获取税务局数据库中的第二部分初始用户特征数据。

3、获取开源数据库中的第三部分初始用户特征数据,第三部分初始用户特征数据包括:社会信用代码、企业经营年限;

可以通过预先编写网络爬虫的方式,从一些开源的数据库(如图书馆、研究院等机构)爬取第三部分初始用户特征数据,并存储在本地数据库。

4、基于社会信用代码进行数据匹配,生成用户信息基础表,用户信息基础表包括多个初始用户特征数据。

服务器获取到所有第一部分初始用户特征数据、第二部分初始用户特征数据和第三部分初始用户特征数据之后,可以根据社会信用代码选择属于任一初始用户的所有特征数据,通过去重处理、合并同类项处理将属于该用户的特征数据进行整合。

需要说明的是,若总行发送的数据或外部数据库中的数据与开源数据库中属于同一初始用户同一特征的数据不一致时,以总行发送的数据或外部数据库中的数据为准。

例如,针对社会信用代码为“A”的公司,总行发送的其成立时间为“1年”,开源数据库中的其成立时间为“2年”,以总行发送的“1年”为准;或者,针对社会信用代码为“A”的公司,外部数据库中的其成立时间为“1年”,开源数据库中的其成立时间为“2年”,以总行发送的“1年”为准。

之后,服务器可以并且按照预定的排列规则来确定属于任一企业的所有用户特征数据,从而形成包含有多个初始用户特征数据用户信息基础表。其中,预定的排列规则可以为预先设定的用户信息参照表,如表1所示。

表1

需要说明的是:服务器在生成用户基本信息表后,可能会出现由于外部数据库的数据不全而导致某一企业的某些信息为空的情况,此时,对于少量字段为空的数据,可以由人工进行补充。

S1012、对原始样本数据进行预处理得到处理后的样本数据,将处理后的样本数据作为营销白名单。

其中,对原始样本数据进行预处理得到营销白名单的方式包括但不限于以下步骤:

1、对原始样本数据进行数据清洗,数据清洗包括以下至少一项处理操作:缺失值处理、异常值处理、离散化处理、归一化处理、去重处理、合并同类项处理;

2、剔除原始样本数据中不满足业务要求的初始用户特征数据生成营销白名单,业务要求包括:企业经营年限、企业经营状态、纳税信用等级。

其中,在剔除的时候,将不满足业务要求的用户所对应的所有的初始用户特征数据全部删除,即,当某一企业中的某项数据不满足业务要求时,即将该企业的所有数据进行删除。

本发明实施例中,营销白名单包括多个潜在用户特征数据,潜在用户指代的是经剔除剩余的其他用户,潜在用户特征数据包括潜在用户的当前账户余额数据、年均账户余额数据、账户余额平均增长率数据、账户活跃度数据、企业经营年限数据、纳税信用等级数据、纳税额平均增长率数据。

S1013、确定营销白名单中的每个用户所属的客户类别。

客户类别包括重要价值客户、重要挽留客户、重要发展客户、低价值客户,针对每一个潜在用户,在接收到类别指令时,按照类别指令确定潜在用户所属的客户类别,类别指令携带客户类别信息。

其中,该类别指令可以由人工触发产生,例如:可以让经验丰富的客户经理根据已经掌握的客户信息将营销白名单中的每个用户所属的客户类别进行标注。

S201、基于训练样本数据,通过训练得到人工智能决策树客户类别预测模型。

可采用下述步骤得到人工智能决策树客户类别预测模型:

S2011、根据训练样本获取数据集和属性集,所述数据集包括多个潜在用户样本数据,所述属性集包括当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、企业经营年限、纳税信用等级、纳税额平均增长率7个属性。

S2012、将当前层的上一层中的叶节点包含的样本数据作为当前层的根节点,计算所述根节点的信息熵。

其包括:采用以下公式计算当前层根节点的信息熵:

P

其中,Ent(D

S2013、将属性集中的每种属性依次作为分类指标,以将所述根节点划分为多个叶节点,计算每个叶节点的信息熵。

其包括,获取作为分类指标的属性,将当前层根节点按照预定划分规则划分为多组,将每组的样本数据作为一个叶节点,采用以下公式计算叶节点的信息熵:

P

其中,Ent(D

其中,预定划分规则可由工作人员预先设定,例如:当作为分类指标的属性为企业经营年限时,可将其按照划分规则划分为“企业经营年限<2年”、“2年≤企业经营年限≥5年”、以及“企业经营年限>5年”三种。

S2014、基于所述信息熵以及每个所述叶节点的信息熵,计算每种属性的信息增益,将信息增益数值最大的属性作为当前层的最优划分属性,基于所述最优划分属性将所述根节点划分为多个叶节点。

该步骤包括:(1)采用以下公式计算每种样本类型的信息增益:

其中,Gain(D,a)表示数据集D中属性k的信息增益,V表示以a属性作为分类指标时划分的组数,|D|表示数据集D中的数据数量,|D

(2)按照所述最优划分属性对应的划分规则将所述根节点划分为多个叶节点。在一种可能的实现方式中,其人工智能决策树类型如图2所示。

以下将对人工智能决策树生成步骤进行详细说明,其包括以下步骤:

一、准备训练数据[n_samples,n_features]和类别标签[n_samples]。

二、参数设置。

sklearn.tree.DecisionTreeClassifier()

参数含义:

1、criterion:string,optional(default="gini")

(1)criterion='gini',分裂节点时评价准则是Gini指数。

(2)criterion='entropy',分裂节点时的评价指标是信息增益。

2、max_depth:int or None,optional(default=None)。指定树的最大深度。如果为None,表示树的深度不限。直到所有的叶子节点都是纯净的,即叶子节点中所有的样

本点都属于同一个类别。或者每个叶子节点包含的样本数小于min_samples_split。

3、splitter:string,optional(default="best")。指定分裂节点时的策略。

(1)splitter='best',表示选择最优的分裂策略。

(2)splitter='random',表示选择最好的随机切分策略。

4、min_samples_split:int,float,optional(default=2)。表示分裂一个内部节点需要的做少样本数。

(1)如果为整数,则min_samples_split就是最少样本数。

(2)如果为浮点数(0到1之间),则每次分裂最少样本数为ceil(min_samples_split*n_samples)

5、min_samples_leaf:int,float,optional(default=1)。指定每个叶子节点需要的最少样本数。

(1)如果为整数,则min_samples_split就是最少样本数。

(2)如果为浮点数(0到1之间),则每个叶子节点最少样本数为

ceil(min_samples_leaf*n_samples)

6、min_weight_fraction_leaf:float,optional(default=0)指定叶子节点中样本的最小权重。

7、max_features:int,float,stringor None,optional default=None),搜寻最佳划分的时候考虑的特征数量。

(1)如果为整数,每次分裂只考虑max_features个特征。

(2)如果为浮点数(0到1之间),每次切分只考虑int(max_features*n_features)个特征。

(3)如果为'auto'或者'sqrt',则每次切分只考虑sqrt(n_features)个特征。

(4)如果为'log2',则每次切分只考虑log2(n_features)个特征。

(5)如果为None,则每次切分考虑n_features个特征。

(6)如果已经考虑了max_features个特征,但还是没有找到一个有效的切分,那么还会继续寻找下一个特征,直到找到一个有效的切分为止。

8、random_state:int,RandomState instance or None,optional(default=None)

(1)如果为整数,则它指定了随机数生成器的种子。

(2)如果为RandomState实例,则指定了随机数生成器。

(3)如果为None,则使用默认的随机数生成器。

9、max_leaf_nodes:int or None,optional(default=None)。指定了叶子节点的最大数量。

(1)如果为None,叶子节点数量不限。

(2)如果为整数,则max_depth被忽略。

三、用训练数据拟合分类器模型。

clf=tree.DecisionTreeClassifier(criterion='entropy')clf.fit(x_train,y_train)

四、用测试集对模型进行测试,评估模型。

五、重新调整参数。

六、重新用训练数据拟合分类器模型,测试,评估模型,并与之前的结果比较。

S301、获取目标用户特征数据。

其中,获取方式包括以下步骤:

目标用户登陆银税服务大厅、该行门户网站跳转、该行企业网银跳转中任一入口后,通过该行企业网银或企业掌银勾选《涉税信息授权书》,授权该行使用其税务信息;

从税务管理系统做数据筛选获取目标用户特征数据。

S401、将目标用户特征数据作为客户类别预测模型的输入,输出目标用户所属的客户类别。

S501、显示目标用户所属的客户类别,以方便客户经理根据客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。

例如:当显示该目标用户的客户类别为“重要价值客户”时,客户经理可以向该目标用户推荐高价值理财产品,为制定有针对性的理财方案。

本发明实施例提供的方法,通过获取训练样本数据,训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别;基于训练样本数据,通过训练得到人工智能决策树客户类别预测模型;获取目标用户特征数据;将目标用户特征数据作为客户类别预测模型的输入,输出目标用户所属的客户类别;显示目标用户所属的客户类别,以方便客户经理根据客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。本发明根据多个用户的特征数据以及客户类别建立人工智能决策树客户类别预测模型,并基于该人工智能决策树客户类别预测模型能够快速得到每个用户的类型,进而方便针对每个用户实行不同的营销计划、以及营销不同的产品,实现了针对不同的用户定制个性化数据,用户群体针对性强,提高了营销成功率。

图3是本发明实施例提供的一种基于人工智能决策树的营销装置的结构示意图。如图3所示,其包括:

训练样本数据获取模块310,其用于获取训练样本数据,所述训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别,所述潜在用户特征数据包括:潜在用户的当前账户余额数据、年均账户余额数据、账户余额平均增长率数据、账户活跃度数据、企业经营年限数据、纳税信用等级数据、纳税额平均增长率数据,潜在用户所属的客户类别为重要价值客户、重要挽留客户、重要发展客户、低价值客户中的一种;

预测模型生成模块320,其用于基于所述训练样本数据,通过训练得到人工智能决策树客户类别预测模型;

特征数据获取模块330,其用于获取目标用户特征数据;

输入模块340,其用于将所述目标用户特征数据作为所述客户类别预测模型的输入,输出所述目标用户所属的客户类别;

显示模块350,其用于显示所述目标用户所属的客户类别,以方便客户经理根据所述客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品.

在一种可能的实现方式中,其还包括:

原始样本采集模块,其用于采集原始样本数据,所述原始样本数据包括多个初始用户特征数据;

营销白名单生成模块,其用于对原始样本数据进行预处理得到营销白名单,所述营销白名单包括多个潜在用户特征数据;

确定模块,其用于确定所述营销白名单中的每个潜在用户所属的客户类别。

在一种可能的实现方式中,所述原始样本采集模块还用于:

获取总行下发的第一部分初始用户特征数据,所述第一部分初始用户特征数据包括:社会信用代码、当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、纳税额平均增长率;

获取外部数据库中的第二部分初始用户特征数据,所述第二部分初始用户特征数据包括:社会信用代码、纳税信用等级;

获取开源数据库中的第三部分初始用户特征数据,所述第三部分初始用户特征数据包括:社会信用代码、企业经营年限、企业经营状态;

基于所述社会信用代码进行数据匹配,生成用户信息基础表,所述用户信息基础表包括多个初始用户特征数据。

在一种可能的实现方式中,所述营销白名单生成模块还用于:对原始样本数据进行数据清洗,所述数据清洗包括以下至少一项处理操作:缺失值处理、异常值处理、离散化处理、归一化处理、去重处理、合并同类项处理;

剔除原始样本数据中不满足业务要求的初始用户特征数据生成所述营销白名单,所述业务要求包括:企业经营年限、企业经营状态、纳税信用等级。

在一种可能的实现方式中,所述确定模块还用于:

针对每一个潜在用户,在接收到类别指令时,按照所述类别指令确定所述潜在用户所属的客户类别,所述类别指令携带客户类别信息。

在一种可能的实现方式中,所述预测模型生成模块320还用于:

根据训练样本获取数据集和属性集,所述数据集包括多个潜在用户样本数据,所述属性集包括当前账户余额、年均账户余额、账户余额平均增长率、账户活跃度、企业经营年限、纳税信用等级、纳税额平均增长率7个属性;

将当前层的上一层中的叶节点包含的样本数据作为当前层的根节点,计算所述根节点的信息熵;

将属性集中的每种属性依次作为分类指标,以将所述根节点划分为多个叶节点,计算每个叶节点的信息熵;

基于所述信息熵以及每个所述叶节点的信息熵,计算每种属性的信息增益,将信息增益数值最大的属性作为当前层的最优划分属性,基于所述最优划分属性将所述根节点划分为多个叶节点。

在一种可能的实现方式中,所述预测模型生成模块320还用于:

采用以下公式计算当前层根节点的信息熵:

P

其中,Ent(D

在一种可能的实现方式中,所述预测模型生成模块302还用于:

获取作为分类指标的属性,将当前层根节点按照预定划分规则划分为多组,将每组的样本数据作为一个叶节点,采用以下公式计算叶节点的信息熵:

P

其中,Ent(D

在一种可能的实现方式中,所述预测模型生成模块302还用于:

采用以下公式计算每种属性的信息增益:

其中,Gain(D,a)表示数据集D中属性k的信息增益,V表示以a属性作为分类指标时划分的组数,|D|表示数据集D中的数据数量,|D

按照所述最优划分属性对应的划分规则将所述根节点划分为多个叶节点。

本发明实施例提供的装置,通过获取训练样本数据,训练样本数据包括多个潜在用户样本数据,每个潜在用户样本数据包括潜在用户特征数据和该潜在用户所属的客户类别;基于训练样本数据,通过训练得到人工智能决策树客户类别预测模型;获取目标用户特征数据;将目标用户特征数据作为客户类别预测模型的输入,输出目标用户所属的客户类别;显示目标用户所属的客户类别,以方便客户经理根据客户类别制定该客户类别对应的线下营销计划,或者,营销该客户类别对应的产品。本发明根据多个用户的特征数据以及客户类别建立人工智能决策树客户类别预测模型,并基于该人工智能决策树客户类别预测模型能够快速得到每个用户的类型,进而方便针对每个用户实行不同的营销计划、以及营销不同的产品,实现了针对不同的用户定制个性化数据,用户群体针对性强,提高了营销成功率。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号