首页> 中国专利> 一种目标用户群体的确定方法和装置

一种目标用户群体的确定方法和装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本说明书实施例提供一种目标用户群体的确定方法和装置，其中的方法包括：根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；根据种子用户的用户特征，获取所述种子用户的相似用户群体；根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

著录项

公开/公告号CN108537567A

专利类型发明专利
公开/公告日2018-09-14

原文格式PDF
申请/专利权人阿里巴巴集团控股有限公司;
展开▼

申请/专利号CN201810182272.6
发明设计人郭晓波;
展开▼

申请日2018-03-06
分类号G06Q30/02(20120101);G06Q30/06(20120101);
代理机构11415 北京博思佳知识产权代理有限公司;
代理人林祥
地址英属开曼群岛大开曼资本大厦一座四层847号邮箱
入库时间 2023-06-19 06:29:52

法律信息

法律状态公告日

法律状态信息

法律状态
2020-08-07

授权

授权
2018-10-16

实质审查的生效 IPC(主分类):G06Q30/02 申请日:20180306

实质审查的生效
2018-09-14

公开

公开

说明书

技术领域

本说明书涉及计算机技术领域，特别涉及一种目标用户群体的确定方法和装置。

背景技术

在对某特定的产品进行营销时，尽量预先确定该产品要向哪些人群进行营销，人群确定的越准确，越能提高营销的成功率，这可以称为人群精准营销。例如，以保险产品为例，保险产品运营人员可以根据待营销的不同保险产品的特点，分别确定各保险产品的营销人群，对于一种保险产品，可以向人群A营销；对于另一种保险产品，则针对的营销人群可能发生变化，向人群B营销。营销的目标人群的精准，能够有助于提升营销过程中的点击和转化，以较高的效率挖掘潜在的用户流量。因此，在营销产品前，准确的确定其营销人群很重要，这部分人群可以称为目标用户群体。

发明内容

有鉴于此，本说明书提供一种目标用户群体的确定方法和装置，以使得目标用户群体的确定更加精准。

具体地，本说明书一个或多个实施例是通过如下技术方案实现的：

第一方面，提供一种目标用户群体的确定方法，所述方法包括：

根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；

根据所述种子用户的用户特征，获取所述种子用户的相似用户群体；

根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；

将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

第二方面，提供一种目标用户群体的确定装置，所述装置包括：

种子确定模块，用于根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；

群体扩大模块，用于根据所述种子用户的用户特征，获取所述种子用户的相似用户群体；

分值处理模块，用于根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；

目标确定模块，用于将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

第三方面，提供一种目标用户群体的确定设备，所述设备包括存储器、处理器，以及存储在存储器上并可在处理器上运行的计算机指令，所述处理器执行指令时实现以下步骤：

根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；

根据所述种子用户的用户特征，获取所述种子用户的相似用户群体；

根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；

将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

本说明书一个或多个实施例的目标用户群体的确定方法和装置，通过基于种子用户获取相似用户群体，实现人群放大，保证了产品推荐的量级；其次，还通过根据相似用户群体的各个用户的概率分值进行过滤，选取满足预设条件的用户作为推荐产品的目标用户，保证了产品推荐用户的优质，这两个保量和保质的两阶段结合的处理方式，使得在扩大人群量级的同时兼顾了投放人群的优质，提高了目标用户定位的准确性。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例提供的一种目标用户群体的确定方法的流程图；

图2为本说明书一个或多个实施例提供的一种种子用户确定方法；

图3为本说明书一个或多个实施例提供的一种行为偏好值的计算流程；

图4为本说明书一个或多个实施例提供的一种获取种子用户的相似用户群体的流程；

图5为本说明书一个或多个实施例提供的一种显著特征的确定方式；

图6为本说明书一个或多个实施例提供的部分用户特征；

图7为本说明书一个或多个实施例提供的人群过滤条件的示意图；

图8为本说明书一个或多个实施例提供的一种目标用户群体的确定装置的结构图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是一部分实施例，而不是全部的实施例。基于本说明书一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

本说明书一个或多个实施例提供的目标用户群体的确定方法，可以用于确定对于一个特定的待推荐产品，应该向哪些用户进行营销。如下的例子中，将以保险产品的营销为例进行该方法的描述，但是，该方法并不局限于保险产品，同样可以应用于其他产品或者类似的其他场景，比如，广告的定向投放。

图1为本说明书一个或多个实施例提供的一种目标用户群体的确定方法的流程图，该方法以保险产品营销的目标用户群体的确定为例，如图1所示，该方法可以包括：

在步骤100中，根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户。

本步骤中，待推荐的产品可以是保险产品。其中，用户对待推荐产品的关联行为数据，例如，可以包括用户对某个保险产品进行投保、分享、点击等行为的统计数据，这些数据可以是投保次数、分享次数、点击次数或者点击率等。此外，关联行为数据也可以不是用户直接对待推荐产品操作产生的数据，而是在本方法中与用户和待推荐产品都有关系的数据，比如，可以是用于估计用户是否是待推荐产品的目标用户概率的数据，这些数据可以是用户的各类支付数据，如，购买保险产品、旅行类目支付、共享单车支付、乘公交和地铁支付、购买境外旅行产品等。

以一个特定的待推荐产品为例，用户对该产品的关联行为数据，可以包括不同行为类型的数据。比如，“投保”是一个行为类型，该行为类型的关联行为数据可以是投保次数；又比如，“点击”是另一个行为类型，该类型对应的关联行为数据可以是点击次数。在确定一个用户是否是待推荐产品的种子用户时，可以综合上述不同行为类型的关联行为数据来判断。

图2为本说明书一个或多个实施例提供的一种种子用户确定方法，如图2所示，该方法可以包括：

在步骤200中，分别对于每个用户，确定所述用户对应各个行为类型的行为偏好值，所述行为偏好值用于表示所述用户在所述行为类型上对待推荐产品的偏好度。

种子用户的确定，可以是由一个包括众多用户的用户群体中确定哪些用户是种子用户。那么，对于该用户群体中的每一个用户，都可以计算该用户分别在不同行为类型上对待推荐的保险产品的偏好度，该偏好度可以用行为偏好值表示，用于表示用户在某个行为类型上是否体现出了对该保险产品的足够兴趣。

例如，用户在“投保”行为上的行为偏好值，如果该行为偏好值较高，也许说明该用户对待推荐的保险产品的投保量较大，可以体现出对该产品有兴趣。

又例如，用户在“分享”行为上的行为偏好值，如果该行为偏好值较高，说明该用户在对该产品的分享上足够活跃，有着较高的分享次数。

用户在每一种行为类型对应的行为偏好值，可以按照统一的计算逻辑得到。图3示例了一种行为偏好值的计算流程，该流程以“点击”这个行为类型为例描述，同样适用于“投保”、“点击”等其他的行为类型下的行为偏好值计算。

在步骤300中，采集用户每天对待推荐产品执行所述行为类型的关联行为数据、以及关联行为数据对应的行为日期。

本步骤采集的数据可以用户每天对待推荐产品的点击次数，以及该点击次数的产生日期(注意，该日期是行为实际发生的日期，不是采集日期，比如，在某天点击了三次，那么“3”这个数据是该天产生的，有可能过了两天才采集该数据)。例如，如下表1示例：

表1点击行为的关联行为数据

行为日期点击次数2017-3-1532017-3-165…………

在步骤302中，根据所述关联行为数据和行为日期，确定所述用户在所述行为类型上对待推荐产品的长期偏好和短期偏好。

本步骤中，对于每个用户可以计算两个数据，一个是用户在特定行为类型上对产品的长期偏好数据weight_l，另一个是用户在该行为类型上对产品的短期偏好数据weight_s。其中，长期偏好数据可以是依据第一时间段内采集的关联行为数据得到，短期偏好数据可以是依据第二时间段内采集的关联行为数据得到，第一时间段大于第二时间段。举例来说，以当前方法处理的时间为基准，往前推(30+7)天，获取这37天采集的数据，包括其中每天的关联行为数据(步骤300中采集的数据)。距离当前基准时间最近的7天，可以称为第二时间段，另外的那30天可以称为第一时间段。即在时间轴上的排列顺序可以是“第一时间段——第二时间段——当前时间”。上述的“30”、“7”只是示例，但并不限制于此，可以改变数值。

不论是长期偏好数据还是短期偏好数据，都可以按照如下的公式(1)进行计算，该公式可以是根据关联行为数据和行为日期来确定偏好数据，并且对不同行为日期的数据进行了时间加权，按照时间远近进行衰减加权。

其中，weight_ipv表示长期偏好数据或者短期偏好数据，insured_pv_1d表示步骤300中采集到的每天的关联行为数据，bizdate表示当前日期，ipv_date表示insured_pv_1d所产生的日期，data表示第一时间段或者第二时间段的天数，例如，30天或者7天，diff()函数用来计算日期的天数之差。

在得到weight_ipv后，还可以进行对数处理和归一化处理。

例如，在上述步骤计算得到weight_ipv之后，不同用户的数据的尺度差异较大，从业务上和数据处理技巧上来考虑，需要对weight_ipv进行对数化处理，将其值域尺度缩小到合理的范围之内，其计算公式可以为公式(2):

log_weight_ipv＝log_α(weight_ipv)………………(2)

其中，log_weight_ipv表示对数化之后的weight_ipv，log_α表示对数函数，weight_ipv由公式(1)计算得到，a为函数的底数。

又例如，在对数化处理之后得到了log_weight_ipv，但是，为了增强结果的可读性和使用便捷性，可以将这个指标再归一化到(0,1]区间上，例如，可以采用Min/Max归一化方法，其计算公式为如下公式(3)：

其中，公式中添加拉普拉斯平滑λ，避免x-min＝0或max-min＝0的情况，weight_{l,s}表示归一化后的长期偏好数据或短期偏好数据，min_log_weight_ipv表示不同用户对应的log_weight_ipv的最小值，max_log_weight_ipv表示不同用户对应的log_weight_ipv的最大值，k例如可以取值1或其他数值。

在步骤304中，将长期偏好和短期偏好进行加权组合，得到所述用户在所述行为类型上对所述待推荐产品的行为偏好值。

例如，可以按照如下的公式(4)进行组合：

weight_t＝α*weight_l+(1-α)*weight_s………………(4)

本例子中，weight_t表示用户在点击行为上对待推荐产品的行为偏好值，weight_l表示用户在点击行为上对待推荐产品的长期偏好，weight_s表示用户在点击行为上对待推荐产品的短期偏好，该长期偏好和短期偏好可以是上述通过公式(1)计算并对数化和归一化后的数据。此外，参数a的数值设定属于一个非平凡过程，它通常高度依赖于数据的特点，可以依据经验设置。还需要说明的是，在本说明书一个或多个实施例的不同公式中，部分公式都采用了相同的参数a，但这并不是限制于不同公式中的参数a必须相同，在不同的公式中，参数a可以是不同的，具体的数值设定依据各公式的实际情况确定。

在步骤202中，将所述不同行为类型对应的行为偏好值进行组合，得到所述用户对所述待推荐产品的综合行为偏好值。

经过步骤200的处理，对于每一个用户，已经可以得到该用户分别在不同行为类型下对待推荐产品的行为偏好值。本步骤中，可以将同一个用户的不同行为类型的行为偏好值进行组合，得到用户对产品的综合行为偏好值。

例如，以不同的行为类型包括“投保”、“分享”、“点击”、“其它出行方式支付”等为例，可以分别设置不同行为类型在组合时的权重。如下表2示例：

表2行为类型对应的数据权重

行为类型组合权重投保8分享4点击2出行方式支付1

根据表2示例的权重，可以将属于同一用户的不同行为类型对应的行为偏好值进行组合，得到用户对待推荐产品的综合行为偏好值，如公式(5)：

score＝∑(ω_i*weight_t)………………(5)

其中，score是综合行为偏好值，weight_t表示用户在某一行为类型的行为偏好值，ω表示对应该行为类型的组合权重(比如，该权重可以是2^n(n＝0,1,2,3))。每一个用户都可以得到一个对待推荐产品的综合行为偏好值。此外，为了保证最终综合行为偏好值的数值仍保持在(0,1)区间内，可以对不同用户的综合行为偏好值进行Min/Max归一化处理。

在步骤204中，根据不同用户的综合行为偏好值，将所述综合行为偏好值在预设数值范围内的用户，确定为所述待推荐产品的种子用户。

例如，可以设定一个预设的数值范围，若用户的综合行为偏好值在该预设数值范围内，可以确定该用户为待推荐产品的种子用户。

最终得到的种子用户的数量可以有多个。

在步骤102中，根据种子用户的用户特征，获取种子用户的相似用户群体。

在步骤100获得种子用户后，可以基于这些种子用户进行人群放大，以帮助保险产品的运营人员挖掘更多的潜在用户流量，满足产品投放的人群量级需求。本步骤中，可以基于种子用户寻找其相似用户群体。

例如，可以按照图4所示例的流程，获取种子用户的相似用户群体：

在步骤400中，确定种子用户的显著特征。

例如，种子用户可以具有人口属性、社会/生活属性、行为习惯、兴趣偏好等多种特征，可以由这些特征中选择能够将种子用户与普通用户明显区别的特征，作为种子用户的显著特征。

如下的图5示例了一种显著特征的确定方式，可以包括如下处理：

在步骤500中，构建普通用户和种子用户的特征向量，所述特征向量中包括：多个用户特征，每个用户特征是一个包括多个用户的特征值的特征序列。

图6示例了部分用户特征，可以包括性别、年龄、学历等人口属性，还包括职业、是否有房、是否有车、资产等级等社会/生活属性，还包括交通方式、餐饮习惯等行为习惯，以及包括购物偏好、旅行偏好、运动偏好等兴趣偏好。

本步骤中，可以结合图6中示例的用户特征，构建特征向量。

例如，构建特征向量U_F_{s，c}＝{F₁，F₂，…，F_k，…，F_n}，F＝{v₁，v₂，…，v_k，…，v_n}，其中，U_F_s表示种子用户的特征向量，U_F_c表示普通用户的特征向量，普通用户和种子用户的数量可以1:1。在特征向量中，可以包括多个用户特征，例如，F₁、F₂、F_k等，每一个都是一个用户特征。而每个用户特征可以是一个包括多个用户的特征值的特征序列。例如，v₁、v₂、v_k等是属于同一用户特征的不同特征值。

举例来说，假设种子用户和普通用户的数量都是500个。种子用户的特征向量是{F₁,F₂,…….F_n}，其中的F₁是一个用户特征，例如可以是“年龄”。该F₁是一个特征序列{v₁,v₂,…….v_n}，其中的各个特征值是500个种子用户的年龄，这些年龄可以按照由大到小排序。

在步骤502中，对于每个所述用户特征，计算所述普通用户和种子用户对应所述用户特征的两个特征序列之间的第一差异度和第二差异度。

如上所述，特征向量中的每个用户特征都是一个特征序列，对于每个用户特征，可以得到两个特征序列，一个是种子用户的特征序列，另一个是普通用户的特征序列。本步骤中，可以采用不同的差异度计算方式，计算这两个特征序列之间的差异度。

例如，可以根据余弦相似度cosine similarity，求种子用户与普通用户的两个特征序列的差异度，记作F_DIFF_cosine，可以称为第一差异度。如公式(6)所示：

其中，表示种子用户某用户特征的特征序列，表示普通用户的相同用户特征的特征序列。

例如，还可以根据史密斯沃特曼算法smithwaterman，求种子用户与普通用户的两个特征序列的差异度，记作F_DIFF_{smithwaterman}，可以称为第二差异度。如公式(7)所示：

其中，表示种子用户某用户特征的特征序列，表示普通用户的相同用户特征的特征序列。

在步骤504中，将第一差异度和第二差异度进行组合得到特征差异度。

例如，可以按照公式(8)计算：

dif_F＝α*F_DIFF_consine+(1-α)*F_DIFF_{smithwateramn}………………(8)

其中，F_DIFF_consine表示某个特征的第一差异度，F_DIFF_{smithwateramn}表示相同特征的第二差异度，diff_F表示该特征的特征差异度。该特征差异度可以用于表示在该特征上种子用户和普通用户具有多大的差异。

在步骤506中，将所述特征差异度满足阈值条件的用户特征，确定为所述种子用户的显著特征。

例如，可以设定阈值条件，将特征差异度的数值满足阈值条件的用户特征，确定为种子用户的显著特征，在该显著特征上，种子用户和普通用户具有较为明显的差异。例如，最终得到的显著特征的数量可以是多个。

在步骤402中，获取各个显著特征分别对应的用户列表。

例如，可以根据得到的显著特征，通过倒排(Inverted Table)找到每个显著特征对应的用户列表。如下表3示意：

表3特征-用户对应表

显著特征用户列表feature 1user1user2feature 2user3user4user5………………

在步骤404中，由所述用户列表中，根据至少一个显著特征确定的人群过滤条件，选择满足所述人群过滤条件的至少一个用户，得到相似用户群体。

本步骤中，还可以由上述步骤402得到的用户列表中，进一步过滤，得到满足人群过滤条件的至少一个用户，作为种子用户的相似用户群体。

上述的人群过滤条件，可以是根据选取的至少部分显著特征、以及显著特征间的条件组合得到。如下结合图7进行举例说明：如图7所示，假设显著特征feature 1、feature4、feature 7属于人口属性的特征，feature 2、feature 5、feature 8属于生活特征，等。图7中的and表示在选取用户时，用户的特征要同时具有and联系的各个显著特征，比如，feature 1and feature 4and feature 7，表示所选取的用户的用户特征中要同时具有这三个特征。同理，如果将“feature 1and feature 4”and“feature 2and feature 5”，则用户既要在人口属性中同时具有feature 1and feature 4，也要在生活特征中同时具有feature 2and feature 5。

此外，还可以通过设置人群过滤条件来控制相似用户群体的量级。比如，如果要想扩大相似用户群体的数量，则可以减少显著特征的数量，比如，将人口属性中的feature7去掉，或者，减少显著特征之间的组合条件，比如，and联系的显著特征减少一些，即放宽过滤条件，则可以扩大人群量级。同理，当要缩小相似用户群体的数量时，可以增加条件中的显著特征数量或者特征组合。

在步骤104中，根据相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率。

本步骤中，可以根据某个打分模型，对相似用户群体中各个用户进行打分。

其中，打分模型的依据可以是在步骤500中构建的特征向量，即依据用户的多方面特征进行综合打分，且分值可以是用于表示用户是否是待推荐的保险产品的目标用户的概率。

例如，可以按照回归模型来预测用户的概率分值：

其中，U_F是用户的特征向量，clk表示点击，a属于超参，主要用于调整预测分值范围。此外，本步骤中使用的打分模型不局限于上述的回归模型，也可以采用其他模型，比如，DNN(Deep Neural Network，深度神经网络)，Ensemble Learning(集成学习)。

在步骤106中，将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

例如，可以根据所述概率分值进行排序，选择排序在预设位数的至少一个用户，得到目标用户群体。

又例如，还可以将所述概率分值满足预设阈值范围的至少一个用户，作为目标用户群体。

本例子的目标用户群体的确定方法，基于种子用户获取相似用户群体，实现了人群放大，保证了产品推荐的量级；其次，还通过打分模型对相似用户群体的各个用户进行打分过滤，选取得分高的用户作为推荐产品的目标用户，保证了产品推荐用户的优质，这两个保量和保质的两阶段结合的处理方式，使得在扩大人群量级的同时兼顾了投放人群的优质，提高了目标用户定位的准确性。

此外，在种子用户的显著特征提取过程中，通过采用多种差异度计算方式，使得显著特征的提取更加准确，例如，可以采用强去噪能力的Smith Waterman序列差异与Cosine相似度线性加权来寻找显著性特征。当然，实际实施中也可以采用其他的差异度算法。并且，本方法中的显著性特征提取不依赖人工标注，也不需要先验知识，并且该显著性特征提取方法具有良好的可移植性，易扩展应到其它场景，如广告定向投放。此外，显著特征的获取时可以使用特征向量中所有用户特征，即每个特征都参与计算，而非选取部分特征，这种采用的简单相似思路非常直接，由于其遍历式的计算方式，计算产生的信息损失较少。

再者，该方法通过结合用户的多种类型的关联行为数据来确定种子用户，也使得种子用户的确定更加准确，由此基于种子用户扩散得到的相似用户群体也更加优质；并且，在对相似用户群体中的用户进行打分时，可以综合用户的多种特征得到概率分值，能够更准确的评估用户是目标用户的概率。

此外，该方法还可以方便对人群覆盖量和投放效果进行控制。比如，人群覆盖量可以通过人群过滤条件进行控制，而投放效果可以通过根据概率分值进行排序或者阈值进行控制。

为了实现上述方法，本说明书一个或多个实施例还提供了一种目标用户群体的确定装置，如图8所示，该装置可以包括：种子确定模块81、群体扩大模块82、分值处理模块83和目标确定模块84。

种子确定模块81，用于根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；

群体扩大模块82，用于根据所述种子用户的用户特征，获取所述种子用户的相似用户群体；

分值处理模块83，用于根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；

目标确定模块84，用于将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

在一个例子中，种子确定模块81，具体用于：当所述关联行为数据包括不同行为类型的关联行为数据时，分别对于每个用户，确定所述用户对应各个行为类型的行为偏好值，所述行为偏好值用于表示所述用户在所述行为类型上对待推荐产品的偏好度；将所述不同行为类型对应的行为偏好值进行组合，得到所述用户对所述待推荐产品的综合行为偏好值；根据不同用户的综合行为偏好值，将所述综合行为偏好值在预设数值范围内的用户，确定为所述待推荐产品的种子用户。

在一个例子中，种子确定模块81，在用于确定所述用户对应每个行为类型的行为偏好值时，包括：

采集所述用户每天对所述待推荐产品执行所述行为类型的关联行为数据、以及关联行为数据对应的行为日期；

根据所述关联行为数据和行为日期，确定所述用户在所述行为类型上对待推荐产品的长期偏好和短期偏好，所述长期偏好依据第一时间段内采集的所述关联行为数据得到，所述短期偏好依据第二时间段内采集的所述关联行为数据得到，所述第一时间段大于第二时间段；

将所述长期偏好和短期偏好进行加权组合，得到所述用户在所述行为类型上对所述待推荐产品的行为偏好值。

在一个例子中，群体扩大模块82，具体用于：

构建普通用户和所述种子用户的特征向量，所述特征向量中包括：多个用户特征，每个用户特征是一个包括多个用户的特征值的特征序列；

对于每个所述用户特征，计算所述普通用户和种子用户对应所述用户特征的两个特征序列之间的第一差异度和第二差异度，所述第一差异度和第二差异度采用不同的差异度计算方式得到；

将第一差异度和第二差异度进行组合得到特征差异度，并将所述特征差异度满足阈值条件的用户特征，确定为所述种子用户的显著特征；

根据所述显著特征，确定所述种子用户的相似用户群体。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述方法实施例所示流程中的各个步骤，其执行顺序不限制于流程图中的顺序。此外，各个步骤的描述，可以实现为软件、硬件或者其结合的形式，例如，本领域技术人员可以将其实现为软件代码的形式，可以为能够实现所述步骤对应的逻辑功能的计算机可执行指令。当其以软件的方式实现时，所述的可执行指令可以存储在存储器中，并被设备中的处理器执行。

例如，对应于上述方法，本说明书一个或多个实施例同时提供一种目标用户群体的确定设备，该设备可以包括处理器、存储器、以及存储在存储器上并可在处理器上运行的计算机指令，所述处理器通过执行所述指令，用于实现如下步骤：

根据用户对待推荐产品的关联行为数据，确定所述待推荐产品的种子用户；

根据所述种子用户的用户特征，获取所述种子用户的相似用户群体；

根据所述相似用户群体中各个用户的用户特征，得到所述用户的概率分值，所述概率分值用于表示所述用户是待推荐产品的目标用户的概率；

将所述概率分值满足预设条件的多个用户确定为目标用户群体，以向所述目标用户群体推荐所述待推荐产品。

上述实施例阐明的装置或模块，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于服务端设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书，凡在本说明书的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书保护的范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种目标用户群体的确定方法和装置 [P] . 中国专利： CN108537567B . 2020.08.07
2. 目标用户群体的确定方法及装置 [P] . 中国专利： CN108153824B . 2020.04.24
3. WIRELESS COMMUNICATION NETWORK SYSTEM, WIRELESS COMMUNICATION APPARATUS, MOBILE TERMINAL, CONNECTION-TARGET SWITCH DETERMINING METHOD, AND CONNECTION-TARGET CHANGE DETERMINING METHOD [P] . 美国专利： US2012322449A1 . 2012-12-20

机译：无线通信网络系统，无线通信装置，移动终端，连接目标开关确定方法和连接目标改变确定方法
4. TARGET SPEECH ESTIMATION MODEL LEARNING DEVICE, TARGET SPEECH DETERMINATION DEVICE, TARGET SPEECH ESTIMATION MODEL LEARNING METHOD, TARGET SPEECH DETERMINATION METHOD AND PROGRAM [P] . 日本专利： JP2019139000A . 2019-08-22

机译：目标言语估计模型学习装置，目标言语确定装置，目标言语估计模型学习方法，目标言语确定方法和程序
5. Target detecting and determining method for detecting and determining target based on height information and storage medium for storing program executing target detecting and determining method [P] . 美国专利： US8420998B2 . 2013-04-16

机译：用于基于高度信息检测和确定目标的目标检测和确定方法以及用于存储执行目标检测和确定方法的程序的存储介质