首页> 中国专利> 一种基于用户画像数据确定目标用户的方法与设备

一种基于用户画像数据确定目标用户的方法与设备

摘要

本申请的目的是提供一种基于用户画像数据确定目标用户的方法与设备,首先,生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,接着,获取关于目标用户的用户画像描述信息,然后,基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序,最后,基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。通过该方法使开发人员可以开发出具有较强通用性的用户画像数据筛选工具,不限定用户画像,满足多种筛选条件组合的查询需求,带来有益效果。

著录项

  • 公开/公告号CN113282631A

    专利类型发明专利

  • 公开/公告日2021-08-20

    原文格式PDF

  • 申请/专利权人 上海哔哩哔哩科技有限公司;

    申请/专利号CN202010105367.5

  • 发明设计人 沈佳伟;贾艳祥;

    申请日2020-02-20

  • 分类号G06F16/2457(20190101);G06F16/182(20190101);

  • 代理机构11637 北京智信禾专利代理有限公司;

  • 代理人刘晓楠

  • 地址 200082 上海市杨浦区四平路1945号1641室

  • 入库时间 2023-06-19 12:18:04

说明书

技术领域

本申请涉及计算机数据处理技术领域,尤其涉及一种基于用户画像数据确定目标用户的技术。

背景技术

现有技术中,用户画像数据的确定通常是通过数据平台将用户数据清洗之后,给每个用户打上相应标签,将最终数据存储为宽表,然后采用SQL(Structured QueryLanguage,结构化查询语言)等语言过滤符合条件的用户画像数据。

但是,上述现有的用户画像数据的确定的技术方案在实际应用场景中需要研发人员根据操作用户的不同筛选查询需求开发不同的数据库查询工具,通用性不强,特别是对于多种筛选条件组合的查询需求,代码实现的复杂度、难度也很大。

发明内容

本申请的目的是提供一种基于用户画像数据确定目标用户的方法与设备,以解决现有技术中如何简单快速地从用户画像数据中确定目标用户的技术问题。

根据本申请的一个方面,提供了一种基于用户画像数据确定目标用户的方法,其中,所述方法包括:

生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,其中,所述逻辑查询程序基于对每个属性的预期属性值对应的查询逻辑实现对该属性的预期属性值的查询;

获取关于目标用户的用户画像描述信息,其中,所述用户画像描述信息包括用户画像数据中的属性以及该属性对应的预期属性值;

基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序;

基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

可选地,当用户画像数据中包括多个属性,对应有多个逻辑查询程序,所述方法还包括:

将所述多个逻辑查询程序打包为逻辑查询程序包;

其中,所述基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序包括:

调用所述逻辑查询程序包;

基于所述用户画像描述信息,从所述逻辑查询程序包中确定与所述用户画像描述信息中涉及的属性相对应的一个或多个逻辑查询程序。

可选地,所述基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户包括:

将所述用户画像描述信息及用户画像数据传入所述逻辑查询程序包;

执行所述逻辑查询程序包中与所述用户画像描述信息中涉及的属性相对应的一个或多个逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

可选地,所述用户画像描述信息通过表达式的方式呈现,其中,一个表达式对应一个属性的呈现,所述表达式包括属性定义部分以及预期属性值部分,其中,所述获取关于目标用户的用户画像描述信息包括:

获取通过操作用户在表达式编辑界面上选择输入的关于目标用户的一个或多个表达式呈现信息;

基于所述一个或多个表达式呈现信息生成对应的一个或多个表达式;

其中,所述基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序包括:

基于所述一个或多个表达式确定所述一个或多个表达式中涉及的属性;

基于所述一个或多个表达式中涉及的属性确定与所述涉及的属性相对应的逻辑查询程序。

可选地,所述查询逻辑至少包括:

获取用户画像数据;

解析用户画像描述信息;

比较用户画像数据中属性的属性值与用户画像描述信息中的期望属性值。

可选地,所述方法还包括:

对所述用户画像数据基于预设数据格式进行清洗,其中,所述预设数据格式与所述用户画像描述信息的数据格式相匹配。

可选地,所述逻辑查询程序包包括jar包。

可选地,当所述用户画像描述信息中涉及的属性包括多个属性,所述执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序包括:

基于所述用户画像描述信息对每个用户画像数据执行所述多个属性对应的多个逻辑查询程序,以确定该用户画像数据中的属性值是否匹配所述用户画像描述信息中的预期属性值。

与现有技术相比,本申请的目的是提供一种基于用户画像数据确定目标用户的方法与设备,首先,生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,接着,获取关于目标用户的用户画像描述信息,然后,基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序,最后,基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。通过该方法使开发人员可以开发出具有较强通用性的用户画像数据筛选工具,不限定用户画像,满足多种筛选条件组合的查询需求,带来有益效果。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1示出根据本申请一个方面的一种基于用户画像数据确定目标用户的方法流程图;

图2示出根据本申请另一个方面的一种基于用户画像数据确定目标用户的方法流程图;

图3示出根据本申请另一个方面的一种用于用户画像数据确定目标的系统框图;

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请一个典型的配置中,系统各模块和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

为更进一步阐述本申请所采取的技术手段及取得的效果,下面结合附图及优选实施例,对本申请的技术方案,进行清楚和完整的描述。

图1示出本申请一个方面的一种基于用户画像数据确定目标用户的方法流程图,其中,一个实施例的方法包括:

S11生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,其中,所述逻辑查询程序基于对每个属性的预期属性值对应的查询逻辑实现对该属性的预期属性值的查询;

S12获取关于目标用户的用户画像描述信息,其中,所述用户画像描述信息包括用户画像数据中的属性以及该属性对应的预期属性值;

S13基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序;

S14基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

上述方法通过构建逻辑查询程序,基于获取到的目标用户的用户画像描述信息确定对应的逻辑查询程序,可方便地从用户画像数据中确定匹配用户画像描述信息对应的目标用户,不限定用户属性信息,通用性强。

在本申请中,所述方法通过设备1执行,所述设备1为计算机设备和/或云,所述计算机设备包括但不限于个人计算机、笔记本电脑、工业计算机、网络主机、单个网络服务器、多个网络服务器集;所述云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。

在此,所述计算机设备和/或云仅为举例,其他现有的或者今后可能出现的设备和/或资源共享平台如适用于本申请也应包含在本申请的保护范围内,在此,以引用的方式包含于此。

在该实施例中,在所述步骤S11中,所述生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,其中,所述逻辑查询程序基于对每个属性的预期属性值对应的查询逻辑实现对该属性的预期属性值的查询。

其中,所述用户画像数据通常是采用数据库的方式保存,其中每个用户画像数据至少包括数量不等的属性及其相应属性值,用户画像数据的属性数量在不同的应用场景中不同。例如,在其中的一种应用场景下,电商的用户画像数据往往包括但不限于性别、年龄、区域、会员等级、历史浏览、历史购买、消费金额、消费日期等属性。

所述生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序,是针对用户画像数据中每个属性生成一个逻辑查询程序,通过某个属性的逻辑查询程序可对用户画像数据中该属性的预期属性值进行查询。

其中,当用户数据中包括多个属性,相应生成多个逻辑查询程序。

继续在该实施例中,在所述步骤S12中,所述获取关于目标用户的用户画像描述信息,其中,所述用户画像描述信息包括用户画像数据中的属性以及该属性对应的预期属性值。

其中,所述目标用户的用户画像描述信息是操作用户基于实际应用需求确定的,包括用户画像数据中的相关属性以及相关属性对应的预期属性值。例如,操作用户需要获取用户画像数据中“年龄大于20岁”目标用户,其中,属性为“年龄”,对预期属性值为“大于20岁”。

继续在该实施例中,在所述步骤S13中,所述基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序。

可选地,当用户画像数据中包括多个属性,对应有多个逻辑查询程序,所述方法还包括:

将所述多个逻辑查询程序打包为逻辑查询程序包;

其中,所述步骤S13包括:

调用所述逻辑查询程序包;

基于所述用户画像描述信息,从所述逻辑查询程序包中确定与所述用户画像描述信息中涉及的属性相对应的一个或多个逻辑查询程序。

将多个逻辑查询程序打包为逻辑查询程序包有利于提高确定与用户画像描述信息对应的逻辑查询程序的效率。

继续在该实施例中,在所述步骤S14中,所述基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

可选地,所述步骤S14包括:

将所述用户画像描述信息及用户画像数据传入所述逻辑查询程序包;

执行所述逻辑查询程序包中与所述用户画像描述信息中涉及的属性相对应的一个或多个逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

例如,操作用户需要确定用户画像数据中“区域为上海市徐汇区,年龄大于20岁”的目标用户,其中,所述用户画像描述信息中包括属性为“区域”、“年龄”,执行与所述用户画像描述信息中涉及的属性“区域”、“年龄”相对应的两个逻辑查询程序,从用户画像数据中确定预期属性值为“上海市徐汇区”、“大于20岁”的目标用户。便于快速从用户画像数据中确定预期属性值。

可选地,所述用户画像描述信息通过表达式的方式呈现,其中,一个表达式对应一个属性的呈现,所述表达式包括属性定义部分以及预期属性值部分,其中,所述获取关于目标用户的用户画像描述信息包括:

获取通过操作用户在表达式编辑界面上选择输入的关于目标用户的一个或多个表达式呈现信息;

基于所述一个或多个表达式呈现信息生成对应的一个或多个表达式;

其中,所述步骤S13包括:

基于所述一个或多个表达式确定所述一个或多个表达式中涉及的属性;

基于所述一个或多个表达式中涉及的属性确定与所述涉及的属性相对应的逻辑查询程序。

其中,用户画像描述信息可以通过表达式的方式呈现出来,方便操作用户便捷地编辑目标用户的筛选条件。

其中,表达式呈现信息方式不作限定,例如,可以是“区域|上海市>徐汇区”、“年龄|大于|20”,也可以是其他方式,如适用于本申请也应包含在本申请的保护范围内。

基于表达式呈现信息生成表达式也不作限定,例如,可以是“{“name”:“age”,“expect”:“30”}”,也可以是其他表达式形式,如适用于本申请也应包含在本申请的保护范围内。便于操作用户输入查询需求。

可选地,所述查询逻辑至少包括:

获取用户画像数据;

解析用户画像描述信息;

比较用户画像数据中属性的属性值与用户画像描述信息中的期望属性值。

在一种应用场景中,用户画像数据的一个属性对应一个逻辑查询程序,目标用户的用户画像描述信息通过一个或多个表达式呈现,基于所述一个或多个表达式中涉及的属性从逻辑查询程序包中确定与所述涉及的属性相对应的一个或多个逻辑查询程序,执行所述的一个或多个逻辑查询程序,获取用户画像数据,解析用户画像描述信息,比较用户画像数据中属性的属性值与用户画像描述信息中的期望属性值,确定目标用户。明确查询逻辑,方便开发人员开发。

可选地,如图2所示,所述方法还包括:

S21对所述用户画像数据基于预设数据格式进行清洗,其中,所述预设数据格式与所述用户画像描述信息的数据格式相匹配。

获得符合预设数据格式的用户画像数据,可以提高基于查询需求确定目标用户的效率。

可选地,所述逻辑查询程序包包括jar包。jar包可以跨平台调用。

可选地,当所述用户画像描述信息中涉及的属性包括多个属性,所述执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序包括:

基于所述用户画像描述信息对每个用户画像数据执行所述多个属性对应的多个逻辑查询程序,以确定该用户画像数据中的属性值是否匹配所述用户画像描述信息中的预期属性值。所述方法可以支持操作用户输入多种查询需求的组合,具有较好的灵活性。

如图3示出根据本申请另一个方面的一种用于用户画像数据确定目标的系统框图,其中,一个实施例的所述系统包括:

MySQL数据库;

HDFS(Hadoop Distributed File System,Hadoop分布式文件系统);

Spark流计算平台;

用于数据清洗、表达式解析的设备1。

在所述系统的一种应用场景中,将用户画像数据里每个属性对应的查询,抽象定义为一个表达式类,通过编码将表达式包含的逻辑实现,生成逻辑查询程序,其中,所述逻辑查询程序或者表达式类中包含该属性对应值的获取、预期属性值表达式解析、属性值与预期属性值比较等逻辑。

所有逻辑查询程序可以合并为一个逻辑查询程序包,例如,合并打包成一个jar包。将逻辑查询程序包或者jar包上传到Spark流计算平台。

目标用户的用户描述信息由一个或多个属性的表达式组成,操作用户根据其需求在表达式编辑页面输入相关属性的预期属性值,表达式编辑页面上相关属性的展示与相应属性的表达式的实现一一对应,操作用户通过编辑表达式页面选择需要的属性的表达式并填写预期属性值,系统将经这些属性的表达式获取的目标用户的用户描述信息保存在MySQL数据库,相应地作为一个待执行任务。

Spark流计算平台从MySQL数据库获取该待执行任务并执行,获取目标用户的用户描述信息,从HDFS获取用户画像数据,使用上述jar包构建出一套数据处理工作流,将经过设备1的数据清洗模块清洗得到的干净的用户画像数据以及经过设备1的表达式解析模块解析出的目标用户的相关属性和预期属性值输入该数据处理工作流,基于目标用户的相关属性和预期属性值对干净的用户画像数据进行匹配计算后,确定目标用户,将确定的目标用户保存到HDFS中。

根据本申请的又一方面,还提供了一种计算机可读介质,所述计算机可读介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述方法。

根据本申请的又一方面,还提供了一种基于用户画像数据确定目标用户设备,其中,该设备包括:

一个或多个处理器;以及

存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。

例如,计算机可读指令在被执行时使所述一个或多个处理器:生成用于对用户画像数据中每个属性的预期属性值进行查询的逻辑查询程序;获取关于目标用户的用户画像描述信息;基于所述用户画像描述信息,确定与所述用户画像描述信息中涉及的属性相对应的逻辑查询程序;基于所述用户画像描述信息、用户画像数据执行与所述用户画像描述信息中涉及的属性相对应的所述逻辑查询程序,确定匹配所述用户画像描述信息中预期属性值的用户画像数据所对应的用户为目标用户。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号