首页> 中国专利> 基于聚类的客户分类方法、装置、设备及存储介质

基于聚类的客户分类方法、装置、设备及存储介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请涉及人工智能技术领域，揭示了一种基于聚类的客户分类方法、装置、设备及存储介质，其中方法包括：采用预设聚类算法和预设聚类数量对各个客户数据进行划分得到多个第一聚类集；采用评估维度与高低分位点比例映射表对第一聚类集分别进行每个评估维度的高分位点评分和低分位点评分计算；根据第一聚类集对应的各个高分位点评分及各个低分位点评分对第一聚类集中的客户数据进行划分得到第二聚类集及未归类客户数据集；对第二聚类集进行质心计算得到目标质心；根据各个目标质心将各个未归类客户数据集中的客户数据划分到各个第二聚类集中得到客户分类结果。针对预设聚类算法得到的各个类再次调整质心，准确的识别整体数据的前进变化。

著录项

公开/公告号CN113837319A

专利类型发明专利
公开/公告日2021-12-24

原文格式PDF
申请/专利权人平安科技(深圳)有限公司;
展开▼

申请/专利号CN202111234801.0
发明设计人蒋国青;
展开▼

申请日2021-10-22
分类号G06K9/62(20060101);
代理机构44343 深圳市明日今典知识产权代理事务所(普通合伙);
代理人王杰辉;罗秦
地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
入库时间 2023-06-19 13:49:36

说明书

技术领域

本申请涉及到人工智能技术领域，特别是涉及到一种基于聚类的客户分类方法、装置、设备及存储介质。

背景技术

采用kmeans(K均值聚类算法)聚类算法得到的无监督聚类结果作为样本的标定值，然后采用该样本对有监督的聚类模型进行训练，将训练后的有监督的聚类模型用于进行客户分类。因预设聚类算法是无监督的算法，无监督的算法和有监督的聚类模型的算法的计算原理可能存在差别，导致训练后的有监督的聚类模型无法100％的预测无监督的算法的输出结果，降低了训练后的有监督的聚类模型预测的准确性。而且训练后的有监督的聚类模型的各个类别的标签范围是固定的，无法动态的随着待预测数据的变化而调整，从而进一步降低了训练后的有监督的聚类模型预测的准确性。

发明内容

本申请的主要目的为提供一种基于聚类的客户分类方法、装置、设备及存储介质，旨在解决现有技术采用预设聚类算法得到的无监督聚类结果作为样本的标定值输入有监督的聚类模型进行训练，无监督的算法和有监督的监督模型的算法的计算原理可能存在差别，导致训练后的有监督的聚类模型无法100％的预测无监督的算法的输出结果，降低了训练后的有监督的聚类模型预测的准确性，而且训练后的有监督的聚类模型的各个类别的标签范围是固定的，无法动态的随着待预测数据的变化而调整，从而进一步降低了训练后的有监督的聚类模型预测的准确性的技术问题。

为了实现上述发明目的，本申请提出一种基于聚类的客户分类方法，所述方法包括：

获取多个客户数据；

采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；

采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；

根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；

对所述第二聚类集进行质心计算，得到目标质心；

根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

进一步的，所述采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算的步骤，包括：

任意获取一个所述第一聚类集作为待分析的聚类集；

任意获取一个所述评估维度作为待分析的评估维度；

根据所述待分析的评估维度，对所述待分析的聚类集进行正序排序，得到排序后的聚类集；

从所述评估维度与高低分位点比例映射表中获取与所述待分析的评估维度对应的目标高分位点比例及目标低分位点比例；

根据所述目标高分位点比例和所述待分析的聚类集，对所述待分析的评估维度进行所述高分位点评分计算；

根据所述目标低分位点比例和所述待分析的聚类集，对所述待分析的评估维度进行所述低分位点评分计算；

重复执行所述任意获取一个所述评估维度作为待分析的评估维度的步骤，直至所述评估维度获取完成；

重复执行所述任意获取一个所述第一聚类集作为待分析的聚类集的步骤，直至所述第一聚类集获取完成。

进一步的，所述根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集的步骤，包括：

任意获取一个所述第一聚类集作为待处理的聚类集；

从所述待处理的聚类集中任意获取一个所述客户数据作为待分析的客户数据；

根据所述待处理的聚类集对应的各个所述高分位点评分及各个所述低分位点评分，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集或所述未归类客户数据集中；

重复执行所述从所述待处理的聚类集中任意获取一个所述客户数据作为待分析的客户数据的步骤，直至完成所述待处理的聚类集中的所述客户数据获取；

重复执行所述任意获取一个所述第一聚类集作为待处理的聚类集的步骤，直至完成所述第一聚类集的获取。

进一步的，所述根据所述待处理的聚类集对应的各个所述高分位点评分及各个所述低分位点评分，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集或所述未归类客户数据集中的步骤，包括：

任意获取一个所述评估维度作为待处理的评估维度；

从所述待分析的客户数据中获取与所述待处理的评估维度对应的评分作为目标评分；

将所述待处理的聚类集在所述待处理的评估维度对应的所述低分位点评分作为评分范围的起点，将所述待处理的聚类集在所述待处理的评估维度对应的所述高分位点评分作为所述评分范围的终点；

当所述目标评分位于所述评分范围内，重复执行所述任意获取一个所述评估维度作为待处理的评估维度的步骤，直至完成所述评估维度的获取或所述目标评分没有位于所述评分范围内；

当所述目标评分没有位于所述评分范围内，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述未归类客户数据集中；

当所述目标评分位于所述评分范围内，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集中。

进一步的，所述根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果的步骤，包括：

从各个所述未归类客户数据集中任意获取一个所述客户数据作为待归类的客户数据；

任意获取一个所述目标质心作为待计算的质心；

对所述待归类的客户数据与所述待计算的质心分别进行每个所述评估维度的距离计算，得到多个第一距离；

对各个所述第一距离进行加权求和，得到所述待计算的质心对应的第二距离；

重复执行所述任意获取一个所述目标质心作为待计算的质心的步骤，直至完成所述目标质心的获取；

根据各个所述第二距离，将所述待归类的客户数据归类到各个所述第二聚类集中的一个；

重复执行所述从各个所述未归类客户数据集中任意获取一个所述客户数据作为待归类的客户数据的步骤，直至完成各个所述未归类客户数据集中的所述客户数据的获取；

将各个所述第二聚类集作为所述客户分类结果。

进一步的，所述根据各个所述第二距离，将所述待归类的客户数据归类到各个所述第二聚类集中的一个的步骤，包括：

从各个所述第二距离中找出值最小的所述第二距离作为目标距离；

将所述待归类的客户数据归类到与所述目标距离对应的所述目标质心对应的所述第二聚类集中。

进一步的，所述对所述第二聚类集进行质心计算，得到目标质心的步骤，包括：

任意获取一个所述第二聚类集作为待评估的聚类集；

任意获取一个所述评估维度作为待评估的评估维度；

根据所述待评估的聚类集进行在所述待评估的评估维度的加权计算，得到单维度加权值；

重复执行所述任意获取一个所述评估维度作为待评估的评估维度的步骤，直至完成所述评估维度的获取；

将各个所述单维度加权值作为所述待评估的聚类集对应的所述目标质心；

重复执行所述任意获取一个所述第二聚类集作为待评估的聚类集的步骤，直至完成所述第二聚类集的获取。

本申请还提出了一种基于聚类的客户分类装置，所述装置包括：

客户数据获取模块，用于获取多个客户数据；

第一聚类模块，用于采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；

分位点评分计算模块，用于采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；

第二聚类模块，用于根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；

目标质心计算模块，用于对所述第二聚类集进行质心计算，得到目标质心；

客户分类结果确定模块，用于根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

本申请还提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于聚类的客户分类方法、装置、设备及存储介质，其中方法首先通过采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集，其次通过采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算，根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集，然后通过对所述第二聚类集进行质心计算，得到目标质心，最后通过根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。从而实现了针对预设聚类算法得到的各个类再次调整质心，能准确的识别整体数据的前进变化，而且不需要采用预设聚类算法得到的无监督聚类结果作为样本的标定值输入有监督的聚类模型进行训练以进行客户分类，提高了客户分类的准确性。

附图说明

图1为本申请一实施例的基于聚类的客户分类方法的流程示意图；

图2为本申请一实施例的基于聚类的客户分类装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例中提供一种基于聚类的客户分类方法，所述方法包括：

S1：获取多个客户数据；

S2：采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；

S3：采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；

S4：根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；

S5：对所述第二聚类集进行质心计算，得到目标质心；

S6：根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

本实施例首先通过采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集，其次通过采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算，根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集，然后通过对所述第二聚类集进行质心计算，得到目标质心，最后通过根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。从而实现了针对预设聚类算法得到的各个类再次调整质心，能准确的识别整体数据的前进变化，而且不需要采用预设聚类算法得到的无监督聚类结果作为样本的标定值输入有监督的聚类模型进行训练以进行客户分类，提高了客户分类的准确性。

对于S1，可以获取用户输入的多个客户数据，也可以从数据库中获取多个客户数据，还可以从第三方应用系统中获取多个客户数据。

客户数据包括：客户标识和评估维度数据集。客户标识可以是客户名称、客户ID等唯一标识一个客户的数据。评估维度数据集中包括：评估维度和评分，其中，每个评估维度对应一个评分。评估维度是对客户进行评估的角度。比如，当本申请应用于保险行业时，评估维度包括但不限于：现有贡献、年收入、忠诚度、保费缺口。

可以理解的是，本申请还可以应用于其他领域，比如，数字医疗领域，在此不做限定。

可以理解的是，客户数据还可以包括其他数据，比如，客户年龄、家庭住址，在此不做限定。

对于S2，采用预设聚类算法，将各个所述客户数据聚类划分到数量与所述预设聚类数量相同的聚类集，将每个聚类集作为一个第一聚类集。也就是说，第一聚类集的数量与预设聚类数量相同。

每个所述客户数据只被划分到其中一个第一聚类集，也就是说，不同第一聚类集中的客户数据的客户标识不同。

可选的，预设聚类算法为Kmeans聚类算法。可以理解的是，预设聚类算法还可以是其他聚类算法，在此不做赘述。

其中，采用Kmeans聚类算法，将各个所述客户数据聚类划分到数量与所述预设聚类数量相同的聚类集的实现方法在此不做赘述。

可选的，执行预设脚本，采用预设聚类算法和预设聚类数量，对Hive(基于Hadoop的一个数据仓库工具)数据库中的各个所述客户数据进行聚类划分，将划分得到的每个聚类集作为一个所述第一聚类集。Hive是基于大数据平台的数据仓库工具，可以基于更多数据进行聚类，数据处理速度快，提高了聚类的速度。

对于S3，可以获取用户输入的评估维度与高低分位点比例映射表，也可以从数据库中获取评估维度与高低分位点比例映射表，还可以从第三方应用系统中获取评估维度与高低分位点比例映射表。

评估维度与高低分位点比例映射表包括：评估维度、高分位点比例和低分位点比例。可以理解的是，各个评估维度的高分位点比例可以全部相同，也可以部分相同，还可以全部不同；各个评估维度的低分位点比例可以全部相同，也可以部分相同，还可以全部不同。

可选的，各个评估维度的高分位点比例可以全部相同，各个评估维度的低分位点比例可以全部相同，所述高分位点比例设为90％，所述低分位点比例设为10％。

可选的，各个评估维度的高分位点比例可以全部相同，各个评估维度的低分位点比例可以全部相同，所述高分位点比例设为95％，所述低分位点比例设为5％。

其中，在所述第一聚类集中，根据每个评估维度的高分位点比例进行高分位点评分计算；在所述第一聚类集中，根据每个评估维度的低分位点比例进行低分位点评分计算。也就是说，每个所述第一聚类集对应的高分位点评分的数量和评估维度的数量相同，每个所述第一聚类集对应的低分位点评分的数量和评估维度的数量相同。

比如，当本申请应用于保险行业时，评估维度包括：现有贡献、年收入、忠诚度、保费缺口，则每个所述第一聚类集对应的高分位点评分的数量为4个(现有贡献、年收入、忠诚度、保费缺口各自对应一个高分位点评分)，每个所述第一聚类集对应的低分位点评分的数量为4个(现有贡献、年收入、忠诚度、保费缺口各自对应一个低分位点评分)，在此举例不做具体限定。

比如，评估维度的现有贡献的高分位点比例为90％，将所述第一聚类集中的与现有贡献对应的各个评分按正序排序(从低到高)后，采用从低到高查找，排序位于90％(所述第一聚类集中的客户数据的总数量的90％)的客户数据中的与现有贡献对应的评分作为高分位点评分，在此举例不做具体限定。

比如，对于排序位于90％的客户数据中的与现有贡献对应的评分作为高分位点评分，将所述第一聚类集中的与现有贡献对应的各个评分按正序排序(从低到高)后有100个客户数据，采用从低到高查找，将排序为90的客户数据中的与现有贡献对应的评分作为高分位点评分，在此举例不做具体限定。

比如，将排序位于所述高分位点比例的客户数据中的与现有贡献对应的评分作为高分位点评分，当没有排位位于所述高分位点比例的客户数据时，则将排位小于所述高分位点比例并且最接近所述高分位点比例的客户数据中的与现有贡献对应的评分作为高分位点评分。

比如，将排序位于所述低分位点比例的客户数据中的与现有贡献对应的评分作为低分位点评分，当没有排序位于所述低分位点比例的客户数据时，则将排位大于所述低分位点比例并且最接近所述低分位点比例的客户数据中的与现有贡献对应的评分作为低分位点评分。

对于S4，从所述第一聚类集中，提取出每个评估维度的评分均位于该评估维度的所述高分位点评分和所述低分位点评分之间的所述客户数据，将提取出的各个所述客户数据作为该所述第一聚类集对应的所述第二聚类集，将该所述第一聚类集中剩余的没有被提取的各个所述客户数据作为该所述第一聚类集对应的所述未归类客户数据集。

对于S5，根据所述第二聚类集的与每个评估维度对应的各个评分进行加权计算，将计算得到的各个加权值作为所述第二聚类集对应的目标质心。

对于S6，根据各个所述第二聚类集各自对应的所述目标质心，将各个所述未归类客户数据集中的所述客户数据，划分到距离最近的所述第二聚类集中；在完成各个所述未归类客户数据集中的所述客户数据的划分后，将各个所述第二聚类集作为客户分类结果。

在一个实施例中，上述采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算的步骤，包括：

S31：任意获取一个所述第一聚类集作为待分析的聚类集；

S32：任意获取一个所述评估维度作为待分析的评估维度；

S33：根据所述待分析的评估维度，对所述待分析的聚类集进行正序排序，得到排序后的聚类集；

S34：从所述评估维度与高低分位点比例映射表中获取与所述待分析的评估维度对应的目标高分位点比例及目标低分位点比例；

S35：根据所述目标高分位点比例和所述待分析的聚类集，对所述待分析的评估维度进行所述高分位点评分计算；

S36：根据所述目标低分位点比例和所述待分析的聚类集，对所述待分析的评估维度进行所述低分位点评分计算；

S37：重复执行所述任意获取一个所述评估维度作为待分析的评估维度的步骤，直至所述评估维度获取完成；

S38：重复执行所述任意获取一个所述第一聚类集作为待分析的聚类集的步骤，直至所述第一聚类集获取完成。

本实施例采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算，为后续针对Kmeans聚类得到的各个类再次调整质心提供了基础。

对于S31，任意获取一个所述第一聚类集，将获取的所述第一聚类集作为待分析的聚类集。

对于S32，任意获取一个所述评估维度，将获取的所述评估维度作为待分析的评估维度。

对于S33，将所述待分析的聚类集中的各个所述客户数据，在所述待分析的评估维度进行正序排序(从低到高)，将排序后的所述待分析的聚类集作为排序后的聚类集。

对于S34，根据所述待分析的评估维度在所述评估维度与高低分位点比例映射表中查找评估维度，将在所述评估维度与高低分位点比例映射表中查找到的评估维度对应的高分位点比例作为目标高分位点比例，将在所述评估维度与高低分位点比例映射表中查找到的评估维度对应的低分位点比例作为目标低分位点比例。

对于S35，将所述待分析的聚类集中的与所述待分析的评估维度对应的各个评分中，排序位于所述目标高分位点比例的评分作为目标高位评分，将目标高位评分作为所述待分析的聚类集在所述待分析的评估维度对应的所述高分位点评分。

可以理解的是，当排序位于所述目标高分位点比例的评分不存在时，则将排位小于所述目标高分位点比例并且最接近所述目标高分位点比例的评分作为目标高位评分。

对于S36，将所述待分析的聚类集中的与所述待分析的评估维度对应的各个评分中，排序位于所述目标低分位点比例的评分作为目标低位评分，将目标低位评分作为所述待分析的聚类集在所述待分析的评估维度对应的所述低分位点评分。

可以理解的是，当排序位于所述目标低分位点比例的评分不存在时，则将排位小于所述目标低分位点比例并且最接近所述目标低分位点比例的评分作为目标低位评分。

对于S37，重复执行步骤S32至步骤S37，直至所述评估维度获取完成。当完成所述评估维度的获取时，意味着完成了所述待分析的聚类集对应的各个高分位点评分的计算和各个低分位点评分的计算。

对于S38，重复执行步骤S31至步骤S38，直至所述第一聚类集获取完成。当完成所述第一聚类集的获取时，意味着完成了各个所述第一聚类集各自对应的各个高分位点评分的计算和各个低分位点评分的计算。

在一个实施例中，上述根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集的步骤，包括：

S41：任意获取一个所述第一聚类集作为待处理的聚类集；

S42：从所述待处理的聚类集中任意获取一个所述客户数据作为待分析的客户数据；

S43：根据所述待处理的聚类集对应的各个所述高分位点评分及各个所述低分位点评分，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集或所述未归类客户数据集中；

S44：重复执行所述从所述待处理的聚类集中任意获取一个所述客户数据作为待分析的客户数据的步骤，直至完成所述待处理的聚类集中的所述客户数据获取；

S45：重复执行所述任意获取一个所述第一聚类集作为待处理的聚类集的步骤，直至完成所述第一聚类集的获取。

因通过每个聚类的各个评估维度的取值范围去筛选，会发现无法单纯的通过每个评估维度的取值范围来把各个客户数据拆分开，出现本不属于某个聚类的被划分进来，而属于某个聚类的被划分到其它聚类，为了解决该问题，本实施例根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，从而找出了属于某个聚类的被划分到其它聚类的客户数据，提高了客户分类的准确性。

对于S41，任意获取一个所述第一聚类集，将获取的所述第一聚类集作为待处理的聚类集。

对于S42，从所述待处理的聚类集中任意获取一个所述客户数据，将获取的所述客户数据作为待分析的客户数据。

对于S43，对所述待分析的客户数据进行在每个评估维度是否位于所述待处理的聚类集对应的所述高分位点评分及所述低分位点评分之间，当每个评估维度位于所述待处理的聚类集对应的所述高分位点评分及所述低分位点评分之间时，将所述待分析的客户数据划分到所述第二聚类集，否则，将所述待分析的客户数据划分到所述未归类客户数据集。

对于S44，重复执行步骤S42至步骤S44，直至完成所述待处理的聚类集中的所述客户数据获取。当完成所述待处理的聚类集中的所述客户数据的获取时，意味着已经完成所述待处理的聚类集中的各个所述客户数据的划分。

对于S45，重复执行步骤S41至步骤S45，直至完成所述第一聚类集的获取。当完成所述第一聚类集的获取时，意味着已经完成各个所述第一聚类集中的各个所述客户数据的划分。

在一个实施例中，上述根据所述待处理的聚类集对应的各个所述高分位点评分及各个所述低分位点评分，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集或所述未归类客户数据集中的步骤，包括：

S431：任意获取一个所述评估维度作为待处理的评估维度；

S432：从所述待分析的客户数据中获取与所述待处理的评估维度对应的评分作为目标评分；

S433：将所述待处理的聚类集在所述待处理的评估维度对应的所述低分位点评分作为评分范围的起点，将所述待处理的聚类集在所述待处理的评估维度对应的所述高分位点评分作为所述评分范围的终点；

S434：当所述目标评分位于所述评分范围内，重复执行所述任意获取一个所述评估维度作为待处理的评估维度的步骤，直至完成所述评估维度的获取或所述目标评分没有位于所述评分范围内；

S435：当所述目标评分没有位于所述评分范围内，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述未归类客户数据集中；

S436：当所述目标评分位于所述评分范围内，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集中。

本实施例根据所述待处理的聚类集对应的各个所述高分位点评分及各个所述低分位点评分，将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集或所述未归类客户数据集中，从而找出了属于某个聚类的被划分到其它聚类的客户数据，提高了客户分类的准确性。

对于S431，任意获取一个所述评估维度，将获取的所述评估维度作为待处理的评估维度。

对于S432，从所述待分析的客户数据中获取与所述待处理的评估维度对应的评分，将获取的评分作为目标评分。

对于S433，将所述待处理的聚类集在所述待处理的评估维度对应的所述低分位点评分作为评分范围的起点，将所述待处理的聚类集在所述待处理的评估维度对应的所述高分位点评分作为所述评分范围的终点，从而得到了所述待处理的聚类集在所述待处理的评估维度的评分范围。

对于S434，当所述目标评分位于所述评分范围内，意味着所述待分析的客户数据符合当前所属聚类集的要求，重复执行步骤S431至步骤S434，直至完成所述评估维度的获取或所述目标评分没有位于所述评分范围内。当完成所述评估维度的获取，意味着已经对所述待分析的客户数据的各个评估维度完成了是否位于评分范围的评估。

对于S435，当所述目标评分没有位于所述评分范围内，意味着所述待分析的客户数据存在评估维度的评分没有位于评分范围内，所述待分析的客户数据不符合当前所属聚类集的要求，因此可以将所述待分析的客户数据划分到所述待处理的聚类集对应的所述未归类客户数据集中。

对于S436，当所述目标评分位于所述评分范围内，意味着所述待分析的客户数据的各个评估维度的评分均位于评分范围内，所述待分析的客户数据符合当前所属聚类集的要求，因此可以将所述待分析的客户数据划分到所述待处理的聚类集对应的所述第二聚类集中。

在一个实施例中，上述根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果的步骤，包括：

S61：从各个所述未归类客户数据集中任意获取一个所述客户数据作为待归类的客户数据；

S62：任意获取一个所述目标质心作为待计算的质心；

S63：对所述待归类的客户数据与所述待计算的质心分别进行每个所述评估维度的距离计算，得到多个第一距离；

S64：对各个所述第一距离进行加权求和，得到所述待计算的质心对应的第二距离；

S65：重复执行所述任意获取一个所述目标质心作为待计算的质心的步骤，直至完成所述目标质心的获取；

S66：根据各个所述第二距离，将所述待归类的客户数据归类到各个所述第二聚类集中的一个；

S67：重复执行所述从各个所述未归类客户数据集中任意获取一个所述客户数据作为待归类的客户数据的步骤，直至完成各个所述未归类客户数据集中的所述客户数据的获取；

S68：将各个所述第二聚类集作为所述客户分类结果。

本实施例根据各个所述目标质心，对所述未归类客户数据集中的所述客户数据重新进行划分，从而提高了第二聚类集的准确性，提高了客户分类结果的准确性。

对于S61，从各个所述未归类客户数据集中，任意获取一个所述客户数据作为待归类的客户数据。

对于S62，任意获取一个所述目标质心，将获取的所述目标质心作为待计算的质心。

对于S63，对所述待归类的客户数据与所述待计算的质心分别进行每个所述评估维度的距离计算，得到多个第一距离。也就是说，所述第一距离的数量与所述评估维度的数量相同。比如，所述待归类的客户数据的与年收入(评估维度)对应的评分和与所述待计算的质心的与年收入对应的数值之间的距离也就是一个第二距离。

对于S64，对各个所述第一距离进行加权求和，将加权求和得到的数据作为所述待归类的客户数据与所述待计算的质心之间的第二距离。

对于S65，重复执行步骤S62至步骤S65，直至完成所述目标质心的获取。也就是说，每轮计算的第二距离的数量与所述目标质心的数量相同。

对于S66，从各个所述第二距离中找出最小值，将所述待归类的客户数据归类到与找出的最小值对应的所述第二聚类集中。

对于S67，重复执行步骤S61至步骤S67，直至完成各个所述未归类客户数据集中的所述客户数据的获取。当完成各个所述未归类客户数据集中的所述客户数据的获取时，完成了对各个所述未归类客户数据集中的各个所述客户数据的重新划分。

对于S68，将完成了各个所述未归类客户数据集中的各个所述客户数据的重新划分之后的各个所述第二聚类集作为所述客户分类结果。

在一个实施例中，上述根据各个所述第二距离，将所述待归类的客户数据归类到各个所述第二聚类集中的一个的步骤，包括：

S661：从各个所述第二距离中找出值最小的所述第二距离作为目标距离；

S662：将所述待归类的客户数据归类到与所述目标距离对应的所述目标质心对应的所述第二聚类集中。

本实施例实现了根据各个所述第二距离中的最小值，将所述待归类的客户数据进行归类，从而提高了第二聚类集的准确性，提高了客户分类结果的准确性。

对于S661，从各个所述第二距离中找出值最小的所述第二距离，将找出所述第二距离的作为目标距离。

对于S662，将所述待归类的客户数据归类到与所述目标距离对应的所述目标质心对应的所述第二聚类集中，从而实现了对所述待归类的客户数据的重新归类，提高了第二聚类集的准确性。

在一个实施例中，上述对所述第二聚类集进行质心计算，得到目标质心的步骤，包括：

S51：任意获取一个所述第二聚类集作为待评估的聚类集；

S52：任意获取一个所述评估维度作为待评估的评估维度；

S53：根据所述待评估的聚类集进行在所述待评估的评估维度的加权计算，得到单维度加权值；

S54：重复执行所述任意获取一个所述评估维度作为待评估的评估维度的步骤，直至完成所述评估维度的获取；

S55：将各个所述单维度加权值作为所述待评估的聚类集对应的所述目标质心；

S56：重复执行所述任意获取一个所述第二聚类集作为待评估的聚类集的步骤，直至完成所述第二聚类集的获取。

本实施例对所述第二聚类集进行质心计算，实现了对聚类的质心调整，为基于调整后的质心对属于某个聚类的被划分到其它聚类的客户数据进行重新划分提供了基础。

对于S51，任意获取一个所述第二聚类集，将获取的所述第二聚类集作为待评估的聚类集。

对于S52，任意获取一个所述评估维度，将获取的所述评估维度作为待评估的评估维度。

对于S53，根据所述待评估的聚类集中的与所述待评估的评估维度对应的各个评分进行加权计算，将加权计算得到的数据作为单维度加权值。

对于S54，重复执行步骤S52至步骤S55，直至完成所述评估维度的获取。当完成所述评估维度的获取时，意味着完成了待评估的聚类集的各个评估维度的单维度加权值的计算。

对于S55，将各个所述单维度加权值作为所述待评估的聚类集对应的所述目标质心，从而为基于单个评估维度评估客户数据与所述目标质心的距离提供了基础。

对于S56，重复执行步骤S51至步骤S56，直至完成所述第二聚类集的获取。当完成所述第二聚类集的获取时，意味着完成了各个所述第二聚类集的各自对应的目标质心的计算。

参照图2，本申请还提出了一种基于聚类的客户分类装置，所述装置包括：

客户数据获取模块100，用于获取多个客户数据；

第一聚类模块200，用于采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；

分位点评分计算模块300，用于采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；

第二聚类模块400，用于根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；

目标质心计算模块500，用于对所述第二聚类集进行质心计算，得到目标质心；

客户分类结果确定模块600，用于根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存基于聚类的客户分类方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于聚类的客户分类方法。所述基于聚类的客户分类方法，包括：获取多个客户数据；采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；对所述第二聚类集进行质心计算，得到目标质心；根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种基于聚类的客户分类方法，包括步骤：获取多个客户数据；采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集；采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算；根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集；对所述第二聚类集进行质心计算，得到目标质心；根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。

上述执行的基于聚类的客户分类方法，首先通过采用预设聚类算法和预设聚类数量，对各个所述客户数据进行聚类划分，得到多个第一聚类集，其次通过采用获取的评估维度与高低分位点比例映射表，对所述第一聚类集分别进行每个评估维度的高分位点评分计算和低分位点评分计算，根据所述第一聚类集对应的各个所述高分位点评分及各个所述低分位点评分，对所述第一聚类集中的所述客户数据进行划分，得到第二聚类集及未归类客户数据集，然后通过对所述第二聚类集进行质心计算，得到目标质心，最后通过根据各个所述目标质心，将各个所述未归类客户数据集中的所述客户数据划分到各个所述第二聚类集中，得到客户分类结果。从而实现了针对预设聚类算法得到的各个类再次调整质心，能准确的识别整体数据的前进变化，而且不需要采用预设聚类算法得到的无监督聚类结果作为样本的标定值输入有监督的聚类模型进行训练以进行客户分类，提高了客户分类的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于聚类的客户分类方法、装置、设备及存储介质 [P] . 中国专利： CN113837319A . 2021-12-24
2. 基于聚类算法的分类方法、装置、计算机设备及存储介质 [P] . 中国专利： CN111046902A . 2020-04-21
3. CUSTOMER SERVICE ROBOT SESSION TEXT CLASSIFICATION METHOD AND APPARATUS, AND ELECTRONIC DEVICE AND COMPUTER-READABLE STORAGE MEDIUM [P] . 世界知识产权组织专利： WO2020073530A1 . 2020-04-16

机译：客户服务机器人会话文本分类方法和装置，以及电子设备和计算机可读存储介质
4. METHOD, DEVICE, AND APPARATUS FOR PERFORMING VOICEPRINT CLUSTERING ON THE BASIS OF SAMPLE SIZE, AND STORAGE MEDIUM [P] . WO2021051505A1 . 2021-03-25

机译：用于基于样本大小和存储介质执行VoicePrint聚类的方法，设备和装置
5. PUSHING METHOD AND APPARATUS BASED ON RE-CLUSTERING, AND COMPUTER DEVICE AND STORAGE MEDIUM [P] . 世界知识产权组织专利： WO2020073534A1 . 2020-04-16

机译：基于重新聚类的推送方法和装置以及计算机设备和存储介质