首页> 中国专利> 潜在客户识别方法及装置、设备及可读计算机存储介质

潜在客户识别方法及装置、设备及可读计算机存储介质

摘要

本发明实施例涉及通信技术领域,公开了一种潜在客户识别方法及装置、设备及可读计算机存储介质,该方法包括:获取运营商数据,所述运营商数据包括多个用户数据;基于所述运营商数据构建知识图谱,所述知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户;基于所述知识图谱进行数据挖掘,得到挖掘结果;基于所述挖掘结果进行潜在客户识别。通过上述方式,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

著录项

说明书

技术领域

本发明实施例涉及通信技术领域,具体涉及一种潜在客户识别方法及装置、设备及可读计算机存储介质。

背景技术

移动互联网络综合了传统移动通信网络和传统互联网二者的优势,随着第三代移动通信技术3G/长期演进LTE时代的到来,其业务发展的前景不可限量,未来电信运营商的主要收入来源将从语音业务转变为数据业务和基于数据的增值业务。而根据运营商数据识别目标客户,以进行增值业务的推荐是当前一项比较重要的技术。

现有技术中,主要利用数据挖掘技术从用户运营数据中提取符合特定规则的用户记录作为目标客户。再基于这些用户记录,通过短信,手机应用推送,或客服人员电话询问推荐等方式进行客户营销,但此种方式需要有经验的技术人员通过观察大量数据,挖掘出固定的模式,此方式比较依赖人工且存在较大的时间滞后性,而且准确率不够高。

发明内容

鉴于上述问题,本发明实施例提供了一种潜在客户识别方法及装置,克服了上述问题或者至少部分地解决了上述问题。

根据本发明实施例的一个方面,提供了一种潜在客户识别方法,所述方法包括:获取运营商数据,所述运营商数据包括多个用户数据;基于所述运营商数据构建知识图谱,所述知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户;基于所述知识图谱进行数据挖掘,得到挖掘结果;基于所述挖掘结果进行潜在客户识别。

在一种可选的方式中,所述基于所述运营商数据构建知识图谱,包括:建立本体结构,所述本体结构至少包括用户及对应的手机号;基于所述运营商数据及所述本体结构进行数据融合,构建所述知识图谱。

在一种可选的方式中,所述知识图谱还包括社区关联数据,所述基于所述运营商数据构建所述知识图谱还包括:基于所述社区关联数据对所述知识图谱进行补充;将补充后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱,所述第一深度学习模型包括依次连接的嵌入层、特征提取层及特征聚合层。

在一种可选的方式中,所述基于所述知识图谱进行数据挖掘,得到挖掘结果,包括:通过图嵌入方式分别对所述知识图谱的每一所述节点的属性进行优化处理,得到优化处理的知识图谱;基于所述优化处理的知识图谱获取每一用户的重要度;基于所述多个用户数据进行用户画像。

在一种可选的方式中,所述用户数据包括消费行为数据,所述基于所述知识图谱进行数据挖掘,得到挖掘结果还包括:基于所述消费行为数据进行消费关联数据的挖掘,得到对应的挖掘结果。

在一种可选的方式中,所述基于所述挖掘结果进行潜在客户识别,包括:基于预设规则分析所述挖掘结果,得到每一用户的分析结果;基于所述分析结果及第二深度学习模型识别潜在客户。

在一种可选的方式中,所述第二深度学习模型包括:依次连接的输入层、自注意力层、全连接层及输出层,所述基于所述分析结果及深度学习模型识别潜在客户,包括:将所述分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据;将所述预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据;将所述表征数据输入所述全连接层中进行特征组合,输出一特征值至所述输出层,得到对应的识别结果。

根据本发明实施例的另一个方面,提供了一种潜在客户识别装置,包括:获取模块,用于获取运营商数据,所述运营商数据包括多个用户数据;构建模块,用于基于所述运营商数据构建知识图谱,所述知识图谱包括多个节点及节点之间的关联数据;挖掘模块,用于基于所述知识图谱进行数据挖掘,得到挖掘结果;识别模块,用于基于所述挖掘结果进行潜在客户识别。

根据本发明实施例的另一方面,提供了一种设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述潜在客户识别方法的步骤。

根据本发明实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行上述潜在客户识别方法步骤。

本发明实施例中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明第一实施例提供的潜在客户识别方法的流程示意图;

图2示出了本发明第一实施例提供的潜在客户识别方法的本体结构示意图;

图3示出了本发明第二实施例的潜在客户识别装置的结构示意图;

图4示出了本发明第四实施例的设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

图1示出了本发明第一实施例提供的潜在客户识别方法的流程示意图。如图1所示,该潜在客户识别方法包括:

步骤S1,获取运营商数据;

具体地,在本实施例中,首先获取运营商数据,该运营商数据包括多个用户数据,该用户数据包括用户、对应的手机号、手机号码对应的套餐、所在公司、所在住址、用户的属性数据,消费数据等,其中,该属性数据可包括用户的身份、年龄、性别等。

步骤S2,基于运营商数据构建知识图谱;

具体地,基于该运营商数据构建知识图谱,该知识图谱可以包括多个该运营商下的所有用户的关系网络图谱,该关系网络图谱可以包括用户之间的关联关系、套餐与商品之间的组合/互斥关系等。优选地,该知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户。

步骤S3,基于知识图谱进行数据挖掘,得到挖掘结果;

具体地,根据该知识图谱进行数据挖掘,得到对应的挖掘结果,例如,挖掘用户的消费情况、消费习惯、信用评分、行为模式等。

步骤S4,基于挖掘结果进行潜在客户识别;

具体地,根据前述挖掘结果来进行潜在客户的识别,例如,根据用户的消费习惯、消费情况等识别对应的潜在客户。

在本实施例中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

在本实施例的一个优选方案中,该知识图谱包括多个节点,每一节点对应一个用户,可以认为,该知识图谱可以用户为节点构成的关系网络,连接线可代表关联数据,该步骤S2具体包括:

建立本体结构;

具体地,首先建立本体结构,如根据运营商数据,建立本体结构,该本体结构包括至少两个实体,该实体可以为:用户、手机号、套餐、公司、语义标签等,首先根据运营商数据建立本体结构,如图2所示,为本实施例的一优选方案的本体结构示意图。该本体结构可包括:语义标签(如图2中所提及的企业类型、行业属性、用户习惯、用户类型等)、用户、手机号(用户拥有的手机号)、商品库(利用用户手机号购买的)、设备(手机号对应的手机卡嵌入的设备)、账单(手机号码)、公司(用户所在公司)、第三方数据等。

在本实施例的一个优选方案中,该语义标签的建立过程可如下:利用手机号之间的关系定义为带权重的交互关系,如:

weight=tanh(∑call_tiem(x)),其中,call_tiem表示统计期内的通话时间,tanh表示双曲正切函数,将累计通话时间归一化到[0,1]范围内。

基于运营商数据及本体结构进行数据融合,构建知识图谱;

具体地,根据运营商数据及本体结构构建知识图谱,例如,根据每一用户及对应的数据构建子网络,然后根据用户与用户之间的关联数据将子网络组合起来形成知识图谱。

在本实施例的一个优选方案中,可根据本体结构及运营商数据、预设业务规则(一个手机号对应一个用户,一个用户最多只能拥有五个手机号),将不同来源和不同格式的数据进行数据融合,得到对应的三元组实例(实体-属性-值,或实体-关系-实体),并进行对齐、校验等处理,然后存入图数据库,其中,该对齐处理可以包括:属性归一化处理(如对用户的属性值进行规范化处理,对不同套餐的流量统一用G来表示、还可以是时间格式的统一等)、实体对齐(如对不同的实体对象采用相似性推断,得到统一化的描述,如同一设备品牌的不同描述格式改为相同格式描述)。

在本实施例的进一步优选方案中,还对融合的数据进行不一致性验证,如对违反本体规则实体或与当前知识图谱存在冲突的情况进行验证,例如,某个用户的账号的账单金额超过合理范围,或者,不同来源的用户数据的年龄不一致等情况,例如,某个用户才10岁,其账单金额超过10000元,可以认为该数据不合符实际情况,属于出现冲突的情况(不一致),对于不一致的情况,优选设置冲突处理规则,该冲突处理规则可以是预先设置置信度高的数据来源作为优选方式,如,对于因不同数据源出现的身份不匹配的问题,选择置信度较高的数据源作为该用户的身份依据。

在本实施例的一个优选方案中,该知识图谱还包括:社区关联数据,该社区关联数据可以根据用户所在地建立起来,如用户A及B所在地均为M社区,则可以将A、B划分为M社区,该社区关联数据对应的图谱部分是以用户作为节点。

该步骤S2还包括:

基于社区关联数据对知识图谱进行补充;

具体地,基于社区关联数据对知识图谱进行补充;可以根据用户之间的通话记录等关联关系,对实体进行聚类,从而得到以家庭、公司等作为社区的聚类,然后基于这种社区的聚类来进行关系的补充,对于社区的划分,有的边界处比较稀疏,可将不同的节点划分到多个小型社区中,在一种假设情况下,假设在同一社区的节点具有相同的特征,可利用在同一社区的节点具有相同的特征来进行关系的补全,如同事关系,亲属关系等,还可以对节点所缺失的公共属性、标签属性进行补全。

在本实施例的一个优选方案中,遍历每一节点,计算该节点加入到邻居社区时的模块度,得到该邻居社区的模块度,计算该邻居社区模块度与当前所在社区的模块度之间的差值,得到每一节点的每一邻居社区的模块度差值,比较每一模块度差值,选择模块度差值最大的,且该模块度差值大于预设阈值时,将该模块度差值对应的邻居社区作为该节点最终的社区,若每一所述差值小于预设阈值,则将该节点所在社区中的所有节点合并为一个主节点,该主节点的权重为合并的节点的权重之和。其中,该预设阈值可根据实际情况而设,如0.02,或者其他数值,此处对此不作限制。进一步地,若社区对应的节点合并的次数超过预设值时,则不再进行知识图谱进行优化(优选为不对社区关联数据对应的图谱部分进行优化,如不对社区的设置进行优化),该预设值可根据实际情况而设,如3次、5次,或者其他数值,此处对此不作限制。

将补充后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱;

具体地,将优化后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱;该第一深度学习模型包括:依次连接的输入层、嵌入(embedding)层、特征提取层、特征聚合层、目标标签层,其中,该特征提取层包括第一分部(deep part)及第二分部(FM part),该第一部分包括三层前馈神经网络,每一层前馈神经网络包括400个神经元。

首先,将优化后的知识图谱对应的数据输入至输入层中得到对应的字段(例如性别、职业、收入、地区、号码等字段),然后将各种字段输入至嵌入层中,该嵌入层学习每个字段的k维嵌入表征(k为16~32),然后将该每个字段的k维嵌入表征输入至特征提取层中,该第一部分及第二部分分别对k维嵌入表征进行处理,第一部分提取不同字段之间的高纬度特征(高纬度指的是三维及以上的纬度),第二部分提取一维或二维的特征数据。然后将提取的特征数据输入至特征聚合层进行特征连接,得到对应的特征值,并输出至该目标标签层,根据不同的特征值得到不同的标签。进一步地,不同的目标标签有对应的输出层,该目标标签可以包括:用户类型标签、用户喜好标签、用户价值标签、商品标签等。

在本实施例的一个优选方案中,该步骤S3具体包括:

通过图嵌入方式分别对所述知识图谱的每一所述节点的属性进行优化处理,得到优化处理的知识图谱;

具体地,通过图嵌入方式(graph embedding)对每一节点的属性进行优化处理,得到优化处理的知识图谱,优选地,采用deep walk、node2vec技术生成该知识图谱的embedding,如下为学习优化的过程:

输入graph(v,e)的指令,即基于通话关系的手机号网络,该指令具体为:

embedding size:d

walk length:t

window size:w;

输出结果为:节点的embedding,记为Φ;

处理过程为:初始化每个节点的embedding,然后对每一个节点执行如下

基于优化处理的知识图谱获取每一用户的重要度;

具体地,基于优化处理的知识图谱计算每一用户的重要度;

优选地,首先采用公式计算每一节点的中心度,该公式为:

基于多个用户数据进行用户画像;

具体地,根据前述的多个用户数据来进行用户画像,分别以每一用户为中心,对与其关联的数据进行分析,挖掘出对应的语义标签,构建用户的画像,例如,通过用户账单数据的分析,可以得到用户的消费趋势特征;对用户金融数据的分析,可以得到用户信用方面的标签;用户的行为数据可以用来分析用户的消费习惯和消费特点。最终将用户的语义标签,与用户的基本属性、统计特征和关联关系等数据进行融合,可以更好的刻画出用户的画像体系。

在本实施例的一个优选方案中,该步骤S3还可包括:

基于消费行为数据进行消费关联数据的挖掘,得到对应的挖掘结果;

具体地,基于消费行为数据进行消费关联数据的挖掘,如通过对用户订购商品的行为数据的分析,可以挖掘出一些共同的模式出来,比如订购套餐A的用户通常都会订购商品B等商品的组合关联关系。进一步地,还可以分析用户订购商品的时间,地点等上下文环境数据,从而挖掘用户的深层次需求,作为标签特征进一步使用。

在本实施例的一个优选方案中,该步骤S4具体包括:

基于预设规则分析挖掘结果,得到每一用户的分析结果;

具体地,基于预设规则分析挖掘结果,得到每一用户的分析结果,分析结果可以包括:营销渠道(如通过客服中心营销、短信、邮件等方式营销、或促销活动)、营销方式(基于事件触发的自动化营销、个性化推荐、场景化营销)、客户类型(异网客户、流失客户、潜在客户、高价值客户)。该预设规则为根据不同场景的识别客户的方式,该预设规则可为以下的一种:异网客户AND同一社区中含有大量的在网客户、用户平均消费金额<>所订购商品的平均消费金额、用户使用设备中存在异网套餐类型、用户消费场景<>商品适用场景or用户类型<>商品适用类型等;其中,用户类型可以为:(高价值客户可以认为是重要度高于阈值的客户)。

可以在不同的小型社区中,如家庭,同事关系等小型社区,可以很容易识别出其中的异网成员;利用同网通话优惠等营销手段,可以针对性的对异网客户进行转化;或者分析用户历史账单,可以发现现有套餐的不足,以及用户的使用习惯和消费趋势变化;针对套餐与用户消费不相匹配的情况,可以自动推荐一些更符合用户消费习惯的套餐或一些优惠流量包;对同一用户的不同设备,如电话,宽带,手机等设备的情况进行分析,发现其中的异网套餐类型,并针对性的进行捆绑式营销。

基于分析结果及第二深度学习模型识别潜在客户;

具体地,基于分析结果、前述挖掘结果及第二深度学习模型识别潜在客户,该输入层、自注意力层(self-attention)、全连接层及输出层,识别的过程如下:

将分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据;

具体地,将分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据,如语义标签,节点重要度,用户属性等特征输入至输入层,由于语义标签属于高维特征(三维以上),可减少输入数据量,减少特征提取工作。然后在该输入层进行维度转化,统一为预设维度,该预设维度可根据实际情况而设,可以为3维、5维或者其他维度,此处对此不作限制。

将预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据;

具体地,预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据,例如对每一特征进行学习,基于attention机制学习每个特征与其他特征的交互权重,并重新构造该特征的表征数据。

将表征数据输入全连接层中进行特征组合,输出一特征值至所述输出层,得到对应的识别结果;

具体地,将前述表征数据输入至全连接层中,进行逻辑回归算法计算,输出一特征值至输出层,得到潜在客户的识别结果。

在本实施例中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

其次,利用图算法进行用户画像,可扩展图谱的特征及关联数据,提高潜在用户的识别准确性。

图3示出了本发明第二实施例的潜在客户识别装置的结构示意图。该装置包括:获取模块31、与获取模块31连接的构建模块32、与构建模块32连接的挖掘模块33、与挖掘模块33连接的识别模块34,其中:

获取模块31,用于获取运营商数据;

具体地,在本实施例中,首先获取运营商数据,该运营商数据包括多个用户数据,该用户数据包括用户、对应的手机号、手机号码对应的套餐、所在公司、所在住址、用户的属性数据,消费数据等,其中,该属性数据可包括用户的身份、年龄、性别等。

构建模块32,用于基于运营商数据构建知识图谱;

具体地,基于该运营商数据构建知识图谱,该知识图谱可以包括多个该运营商下的所有用户的关系网络图谱,该关系网络图谱可以包括用户之间的关联关系、套餐与商品之间的组合/互斥关系等。优选地,该知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户。

挖掘模块33,用于基于知识图谱进行数据挖掘,得到挖掘结果;

具体地,根据该知识图谱进行数据挖掘,得到对应的挖掘结果,例如,挖掘用户的消费情况、消费习惯、信用评分、行为模式等。

识别模块34,用于基于挖掘结果进行潜在客户识别;

具体地,根据前述挖掘结果来进行潜在客户的识别,例如,根据用户的消费习惯、消费情况等识别对应的潜在客户。

在本实施例中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

在本实施例的一个优选方案中,该知识图谱包括多个节点,每一节点对应一个用户,可以认为,该知识图谱可以用户为节点构成的关系网络,连接线可代表关联数据,该构建模块32具体用于:

建立本体结构;

具体地,首先建立本体结构,如根据运营商数据,建立本体结构,该本体结构包括至少两个实体,该实体可以为:用户、手机号、套餐、公司、标签等,首先根据运营商数据建立本体结构,如图2所示。

在本实施例的一个优选方案中,该实体还可以为语义标签,语义标签的建立过程可如下:利用手机号之间的关系定义为带权重的交互关系,如:

weight=tanh(∑call_tiem(x)),其中,call_tiem表示统计期内的通话时间,tanh表示双曲正切函数,将累计通话时间归一化到[0,1]范围内。

基于运营商数据及本体结构进行数据融合,构建知识图谱;

具体地,根据运营商数据及本体结构构建知识图谱,例如,根据每一用户及对应的数据构建子网络,然后根据用户与用户之间的关联数据将子网络组合起来形成知识图谱。

在本实施例的一个优选方案中,可根据本体结构及运营商数据、预设业务规则(一个手机号对应一个用户,一个用户最多只能拥有五个手机号),将不同来源和不同格式的数据进行数据融合,得到对应的三元组实例(实体-属性-值,或实体-关系-实体),并进行对齐、校验等处理,然后存入图数据库,其中,该对齐处理可以包括:属性归一化处理(如对用户的属性值进行规范化处理,对不同套餐的流量统一用G来表示、还可以是时间格式的统一等)、实体对齐(如对不同的实体对象采用相似性推断,得到统一化的描述,如同一设备品牌的不同描述格式改为相同格式描述)。

在本实施例的进一步优选方案中,还对融合的数据进行不一致性验证,如对违反本体规则实体或与当前知识图谱存在冲突的情况进行验证,例如,某个用户的账号的账单金额超过合理范围,或者,不同来源的用户数据的年龄不一致等情况,例如,某个用户才10岁,其账单金额超过10000元,可以认为该数据不合符实际情况,属于出现冲突的情况(不一致),对于不一致的情况,优选设置冲突处理规则,该冲突处理规则可以是预先设置置信度高的数据来源作为优选方式,如,对于因不同数据源出现的身份不匹配的问题,选择置信度较高的数据源作为该用户的身份依据。

在本实施例的一个优选方案中,该知识图谱还包括:社区关联数据,该社区关联数据可以根据用户所在地建立起来,如用户A及B所在地均为M社区,则可以将A、B划分为M社区,该社区关联数据对应的图谱部分是以用户作为节点。该构建模块32还用于:

基于社区关联数据对知识图谱进行补充;

具体地,基于社区关联数据对知识图谱进行补充;可以根据用户之间的通话记录等关联关系,对实体进行聚类,从而得到以家庭、公司等作为社区的聚类,然后基于这种社区的聚类来进行关系的补充,对于社区的划分,有的边界处比较稀疏,可将不同的节点划分到多个小型社区中,在一种假设情况下,假设在同一社区的节点具有相同的特征,可利用在同一社区的节点具有相同的特征来进行关系的补全,如同事关系,亲属关系等,还可以对节点所缺失的公共属性、标签属性进行补全。

在本实施例的一个优选方案中,遍历每一节点,计算该节点加入到邻居社区时的模块度,得到该邻居社区的模块度,计算该邻居社区模块度与当前所在社区的模块度之间的差值,得到每一节点的每一邻居社区的模块度差值,比较每一模块度差值,选择模块度差值最大的,且该模块度差值大于预设阈值时,将该模块度差值对应的邻居社区作为该节点最终的社区,若每一所述差值小于预设阈值,则将该节点所在社区中的所有节点合并为一个主节点,该主节点的权重为合并的节点的权重之和。其中,该预设阈值可根据实际情况而设,如0.02,或者其他数值,此处对此不作限制。进一步地,若社区对应的节点合并的次数超过预设值时,则不再进行知识图谱进行优化(优选为不对社区关联数据对应的图谱部分进行优化,如不对社区的设置进行优化),该预设值可根据实际情况而设,如3次、5次,或者其他数值,此处对此不作限制。

将补充后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱;

具体地,将优化后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱;该第一深度学习模型包括:依次连接的输入层、嵌入(embedding)层、特征提取层、特征聚合层、目标标签层,其中,该特征提取层包括第一分部(deep part)及第二分部(FM part),该第一部分包括三层前馈神经网络,每一层前馈神经网络包括400个神经元。

首先,将优化后的知识图谱对应的数据输入至输入层中得到对应的字段(例如性别、职业、收入、地区、号码等字段),然后将各种字段输入至嵌入层中,该嵌入层学习每个字段的k维嵌入表征(k为16~32),然后将该每个字段的k维嵌入表征输入至特征提取层中,该第一部分及第二部分分别对k维嵌入表征进行处理,第一部分提取不同字段之间的高纬度特征(高纬度指的是三维及以上的纬度),第二部分提取一维或二维的特征数据。然后将提取的特征数据输入至特征聚合层进行特征连接,得到对应的特征值,并输出至该目标标签层,根据不同的特征值得到不同的标签。进一步地,不同的目标标签有对应的输出层,该目标标签可以包括:用户类型标签、用户喜好标签、用户价值标签、商品标签等。

在本实施例的一个优选方案中,该挖掘模块33具体用于:

通过图嵌入方式分别对所述知识图谱的每一所述节点的属性进行优化处理,得到优化处理的知识图谱;

具体地,通过图嵌入方式(graph embedding)对每一节点的属性进行优化处理,得到优化处理的知识图谱,优选地,采用deep walk、node2vec技术生成该知识图谱的embedding,如下为学习优化的过程:

输入:graph(v,e)的指令,即基于通话关系的手机号网络,该指令具体为:

embedding size:d

walk length:t

window size:w;

输出结果为:节点的embedding,记为Φ;

处理过程为:初始化每个节点的embedding,然后对每一个节点执行如下

基于优化处理的知识图谱获取每一用户的重要度;

具体地,基于优化处理的知识图谱计算每一用户的重要度,优选地,首先采用公式计算每一节点的中心度,该公式为:

基于多个用户数据进行用户画像;

具体地,根据前述的多个用户数据来进行用户画像,分别以每一用户为中心,对与其关联的数据进行分析,挖掘出对应的语义标签,构建用户的画像,例如,通过用户账单数据的分析,可以得到用户的消费趋势特征;对用户金融数据的分析,可以得到用户信用方面的标签;用户的行为数据可以用来分析用户的消费习惯和消费特点。最终将用户的语义标签,与用户的基本属性、统计特征和关联关系等数据进行融合,可以更好的刻画出用户的画像体系。

在本实施例的一个优选方案中,该挖掘模块33还用于:

基于消费行为数据进行消费关联数据的挖掘,得到对应的挖掘结果;

具体地,基于消费行为数据进行消费关联数据的挖掘,如通过对用户订购商品的行为数据的分析,可以挖掘出一些共同的模式出来,比如订购套餐A的用户通常都会订购商品B等商品的组合关联关系。进一步地,还可以分析用户订购商品的时间,地点等上下文环境数据,从而挖掘用户的深层次需求,作为标签特征进一步使用。

在本实施例的一个优选方案中,该识别模块34具体用于:

基于预设规则分析挖掘结果,得到每一用户的分析结果;

具体地,基于预设规则分析挖掘结果,得到每一用户的分析结果,分析结果可以包括:营销渠道(如通过客服中心营销、短信、邮件等方式营销、或促销活动)、营销方式(基于事件触发的自动化营销、个性化推荐、场景化营销)、客户类型(异网客户、流失客户、潜在客户、高价值客户)。该预设规则为根据不同场景的识别客户的方式,该预设规则可为以下的一种:异网客户AND同一社区中含有大量的在网客户、用户平均消费金额<>所订购商品的平均消费金额、用户使用设备中存在异网套餐类型、用户消费场景<>商品适用场景or用户类型<>商品适用类型等;其中,用户类型可以为:(高价值客户可以认为是重要度高于阈值的客户)。

可以在不同的小型社区中,如家庭,同事关系等小型社区,可以很容易识别出其中的异网成员;利用同网通话优惠等营销手段,可以针对性的对异网客户进行转化;或者分析用户历史账单,可以发现现有套餐的不足,以及用户的使用习惯和消费趋势变化;针对套餐与用户消费不相匹配的情况,可以自动推荐一些更符合用户消费习惯的套餐或一些优惠流量包;对同一用户的不同设备,如电话,宽带,手机等设备的情况进行分析,发现其中的异网套餐类型,并针对性的进行捆绑式营销。

基于分析结果及第二深度学习模型识别潜在客户;

具体地,基于分析结果、前述挖掘结果及第二深度学习模型识别潜在客户,该输入层、自注意力层(self-attention)、全连接层及输出层,识别的过程如下:

将分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据;

具体地,将分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据,如语义标签,节点重要度,用户属性等特征输入至输入层,由于语义标签属于高维特征(三维以上),可减少输入数据量,减少特征提取工作。然后在该输入层进行维度转化,统一为预设维度,该预设维度可根据实际情况而设,可以为3维、5维或者其他维度,此处对此不作限制。

将预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据;

具体地,预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据,例如对每一特征进行学习,基于attention机制学习每个特征与其他特征的交互权重,并重新构造该特征的表征数据。

将表征数据输入全连接层中进行特征组合,输出一特征值至所述输出层,得到对应的识别结果;

具体地,将前述表征数据输入至全连接层中,进行逻辑回归算法计算,输出一特征值至输出层,得到潜在客户的识别结果。

在本实施例的一个优选方案中,该潜在客户识别装置包括:应用层、服务差、引擎层、数据表示层、知识挖掘层、及数据层,该应用层包括前述的识别模块34,还用于自动化推荐、N度关系查询(N大于1),相似子图查询、用户画像等;该服务层包括前述的挖掘模块33,还用于场景建模、用户分群行为轨迹分析、关系理解、消费趋势判断等;引擎层包括前述的构建模块32,还用于中心节点发现、语义理解、实体相似度计算等,该数据表示层用于存储前述的知识图谱,所述指示挖局层用于进行用户数据的基础属性聚合、关联关系挖掘、知识补全、标签推断等,数据层用于存储运营商数据,如数据仓库、业务系统、日志数据、第三方数据等。

在本实施例中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

其次,利用图算法进行用户画像,可扩展图谱的特征及关联数据,提高潜在用户的识别准确性。

本发明第三实施例还提供了一种可读计算机存储介质,所述可读计算机存储介质包括存储在计算机存储介质上的计算机程序,所述可读计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述第一实施例中的潜在客户识别方法。

可执行指令具体可以用于使得处理器执行以下操作:

获取运营商数据,所述运营商数据包括多个用户数据;

基于所述运营商数据构建知识图谱,所述知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户;

基于所述知识图谱进行数据挖掘,得到挖掘结果;

基于所述挖掘结果进行潜在客户识别。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

建立本体结构,所述本体结构至少包括用户及对应的手机号;

基于所述运营商数据及所述本体结构进行数据融合,构建所述知识图谱。

在一种可选的方式中,所述知识图谱还包括社区关联数据,所述可执行指令使所述处理器执行以下操作:

基于所述社区关联数据对所述知识图谱进行补充;

将补充后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱,所述第一深度学习模型包括依次连接的嵌入层、特征提取层及特征聚合层。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

通过图嵌入方式分别对所述知识图谱的每一所述节点的属性进行优化处理,得到优化处理的知识图谱;

基于所述优化处理的知识图谱获取每一用户的重要度;

基于所述多个用户数据进行用户画像。

在一种可选的方式中,所述用户数据包括消费行为数据,所述可执行指令使所述处理器执行以下操作:

基于所述消费行为数据进行消费关联数据的挖掘,得到对应的挖掘结果。

在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:

基于预设规则分析所述挖掘结果,得到每一用户的分析结果;

基于所述分析结果及第二深度学习模型识别潜在客户。

在一种可选的方式中,所述第二深度学习模型包括:依次连接的输入层、自注意力层、全连接层及输出层,所述可执行指令使所述处理器执行以下操作:

将所述分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据;

将所述预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据;

将所述表征数据输入所述全连接层中进行特征组合,输出一特征值至所述输出层,得到对应的识别结果。

图4示出了本发明第四实施例的设备的结构示意图,本发明具体实施例并不对设备的具体实现做限定。

如图4所示,该设备可以包括:处理器(processor)402、通信接口(CommunicationsInterface)404、存储器(memory)406、以及通信总线408。

其中:处理器402402、通信接口404、以及存储器406406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402402,用于执行程序410410,具体可以执行上述第一实施例中的潜在客户识别方法的相关步骤。

具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。

处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序410具体可以用于使得处理器402执行以下操作:

获取运营商数据,所述运营商数据包括多个用户数据;

基于所述运营商数据构建知识图谱,所述知识图谱包括多个节点及节点之间的关联数据,所述多个节点包括用户;

基于所述知识图谱进行数据挖掘,得到挖掘结果;

基于所述挖掘结果进行潜在客户识别。

在一种可选的方式中,所述程序410使所述处理器402执行以下操作:

建立本体结构,所述本体结构至少包括用户及对应的手机号;

基于所述运营商数据及所述本体结构进行数据融合,构建所述知识图谱。

在一种可选的方式中,所述知识图谱还包括社区关联数据,所述程序410使所述处理器402执行以下操作:

基于所述社区关联数据对所述知识图谱进行补充;

将补充后的知识图谱对应的数据输入至第一深度学习模型中进行标签预测,得到对应的标签并添加至所述知识图谱,所述第一深度学习模型包括依次连接的嵌入层、特征提取层及特征聚合层。

在一种可选的方式中,所述程序410使所述处理器402执行以下操作:

通过图嵌入方式分别对所述知识图谱的每一所述节点的属性进行优化处理,得到优化处理的知识图谱;

基于所述优化处理的知识图谱获取每一用户的重要度;

基于所述多个用户数据进行用户画像。

在一种可选的方式中,所述用户数据包括消费行为数据,所述程序410使所述处理器402执行以下操作:

基于所述消费行为数据进行消费关联数据的挖掘,得到对应的挖掘结果。

在一种可选的方式中,所述程序410使所述处理器402执行以下操作:

基于预设规则分析所述挖掘结果,得到每一用户的分析结果;

基于所述分析结果及第二深度学习模型识别潜在客户。

在一种可选的方式中,所述第二深度学习模型包括:依次连接的输入层、自注意力层、全连接层及输出层,所述程序410使所述处理器402执行以下操作:

将所述分析结果输入至所述输入层进行维度统一化,输出预设维度的特征数据;

将所述预设维度的特征数据输入至所述自注意力层进行特征学习,输出对应的表征数据;

将所述表征数据输入所述全连接层中进行特征组合,输出一特征值至所述输出层,得到对应的识别结果。

在发明中,根据运营商数据建立知识图谱,根据知识图谱来进行数据挖掘,根据挖掘结果进行潜在客户的识别,可提高识别准确率。

其次,利用图算法进行用户画像,可扩展图谱的特征及关联数据,提高潜在用户的识别准确性。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号