首页> 中国专利> 判断聚类的用户职业分布方法和装置

判断聚类的用户职业分布方法和装置

摘要

本发明提供一种判断聚类的用户职业分布方法和装置,方法包括:基于用户终端提供的定位信息,得到用户终端所在的多个位置信息;从多个位置信息中区分工作地信息和居住地信息;对基于同一居住地信息的多个用户进行聚类;统计聚类的多个用户的工作地信息;根据聚类的用户的工作地信息,判断聚类的用户职业分布。根据本发明,利用用户的定位信息获取用户的位置信息,并进一步区分工作地信息和居住地信息;然后通过聚类对同一居住地信息的多个用户进行聚类,即取得了某一地区的聚类用户的工作地信息;基于工作地信息可以确定用户职业,从而得到该地区的工作的职业信息,以用于进行职业分布的分析。

著录项

  • 公开/公告号CN105630951A

    专利类型发明专利

  • 公开/公告日2016-06-01

    原文格式PDF

  • 申请/专利号CN201510982175.1

  • 发明设计人 王智广;

    申请日2015-12-23

  • 分类号G06F17/30;G06Q50/16;

  • 代理机构北京鼎佳达知识产权代理事务所(普通合伙);

  • 代理人王伟锋

  • 地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)

  • 入库时间 2023-12-18 15:46:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-26

    专利权的转移 IPC(主分类):G06F16/9537 专利号:ZL2015109821751 登记生效日:20220714 变更事项:专利权人 变更前权利人:北京奇虎科技有限公司 变更后权利人:北京奇虎科技有限公司 变更事项:地址 变更前权利人:100088 北京市西城区新街口外大街28号D座112室(德胜园区) 变更后权利人:100015 北京市朝阳区酒仙桥路6号院2号楼1至19层104号内8层801 变更事项:专利权人 变更前权利人:奇智软件(北京)有限公司 变更后权利人:

    专利申请权、专利权的转移

  • 2019-06-07

    授权

    授权

  • 2016-06-29

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20151223

    实质审查的生效

  • 2016-06-01

    公开

    公开

说明书

技术领域

本发明涉及计算机技术领域,具体而言,涉及一种判断聚类的用户职业 分布方法和装置。

背景技术

当用户需要去了解某个小区时,可以方便地从互联网上获取一些小区的 基本信息,比如小区的建成年代、绿化情况、开发商、物业公司、周边配套 等等。

但是,获取小区的居住人员的一些信息则比较困难,一方面是这些信息 比较隐私,另外一方面是居住人员的信息可能是政府或者小区物业拥有的信 息很难提供给个人,比如这个小区住的都是什么人,这些人都从事哪些职业, 都是目前难以解决的问题。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分 地解决上述问题的判断聚类的用户职业分布方法和装置。

依据本发明的一种判断聚类的用户职业分布方法,包括:基于用户终端 提供的定位信息,得到所述用户终端所在的多个位置信息;从所述多个位置 信息中区分工作地信息和居住地信息;对基于同一居住地信息的多个用户进 行聚类;统计聚类的多个用户的工作地信息;根据所述聚类的用户的工作地 信息,判断所述聚类的用户职业分布。

可选地,前述的方法,从所述多个位置信息中区分工作地信息和居住地 信息,具体包括:查询所述多个位置信息对应的场所,根据所述场所从所述 多个位置信息中区分所述用户的工作地信息和居住地信息。

可选地,前述的方法,从所述多个位置信息中区分工作地信息和居住地 信息,具体包括:获取所述多个位置信息对应的定位时间,根据所述定位时 间从所述多个位置信息中区分所述用户的工作地信息和居住地信息。

可选地,前述的方法,根据所述聚类的用户的工作地信息,判断所述聚 类的用户职业分布,具体包括:根据所述聚类的用户的工作地信息,查询位 于所述聚类的用户的工作地的组织机构,根据所述组织机构判断所述聚类的 用户的职业。

可选地,前述的方法,根据所述组织机构判断所述聚类的用户的职业, 具体包括:在位于同一工作地的组织机构为多个时,统计所述多个组织机构 中相同类型的组织机构数量,并按最大组织机构数量对应的组织机构,确定 对应用户的职业。

依据本发明的一种判断聚类的用户职业分布装置,包括:位置信息获取 模块,用于基于用户终端提供的定位信息,得到所述用户终端所在的多个位 置信息;区分模块,用于从所述多个位置信息中区分工作地信息和居住地信 息;聚类模块,用于对基于同一居住地信息的多个用户进行聚类;统计模块, 用于统计聚类的多个用户的工作地信息;职业分布判断模块,用于根据所述 聚类的用户的工作地信息,判断所述聚类的用户职业分布。

可选地,前述的装置,所述区分模块查询所述多个位置信息对应的场所, 根据所述场所从所述多个位置信息中区分所述用户的工作地信息和居住地信 息。

可选地,前述的装置,所述区分模块获取所述多个位置信息对应的定位 时间,根据所述定位时间从所述多个位置信息中区分所述用户的工作地信息 和居住地信息。

可选地,前述的装置,所述职业分布判断模块根据所述聚类的用户的工 作地信息,查询位于所述聚类的用户的工作地的组织机构,根据所述组织机 构判断所述聚类的用户的职业。

可选地,前述的装置,所述职业分布判断模块在位于同一工作地的组织 机构为多个时,统计所述多个组织机构中相同类型的组织机构数量,并按最 大组织机构数量对应的组织机构,确定对应用户的职业。

根据以上技术方案,本发明的判断聚类的用户职业分布方法和装置至少 具有以下优点:

在本发明的技术方案中,利用用户的定位信息获取用户的位置信息,并 进一步区分工作地信息和居住地信息;然后通过聚类对同一居住地信息的多 个用户进行聚类,即取得了某一地区的聚类用户的工作地信息;基于工作地 信息可以确定用户职业,从而得到该地区的工作的职业信息,以用于进行职 业分布的分析。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本 领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的, 而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示 相同的部件。在附图中:

图1示出了根据本发明的一个实施例的判断聚类的用户职业分布方法的 流程图;

图2示出了根据本发明的一个实施例的判断聚类的用户职业分布装置的 框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示 了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不 应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地 理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示,本发明的一个实施例中提供了一种判断聚类的用户职业分 布方法,包括:

步骤110,基于用户终端提供的定位信息,得到用户终端所在的多个位置 信息。在本实施例中,对定位方式不进行限制,例如:用户携带的移动终端 安装有GPS(全球定位系统)模块,则通过GPS模块可以对用户进行定位, 从而得到用户的位置信息。

步骤120,从多个位置信息中区分工作地信息和居住地信息。在本实施例 中,通常每天用户所在的位置不是居住地就是工作地,所以从位置信息中可 区分出工作地信息和居住地信息;在本实施例中,对如何区分工作信息和居 住地信息的方式不进行限制,例如,根据位置信息查询对应的名称,如果是 “某某小区”则可以判断为居住地信息,如果是“某某写字楼”则可以判断 是工作地信息。

步骤130,对基于同一居住地信息的多个用户进行聚类。

步骤140,统计聚类的多个用户的工作地信息。聚类结果可以如下表所示: 对于西二旗智学苑的用户进行聚类,得到聚类后的用户的工作地信息,其中 居住人员所在的公司按人数的多少排名。

小区 公司场所 西二旗智学苑 数码科技广场 西二旗智学苑 汉王大厦 西二旗智学苑 华夏科技大厦 西二旗智学苑 联创大厦 西二旗智学苑 上地科技大厦 西二旗智学苑 百度大厦

步骤150,根据聚类的用户的工作地信息,判断聚类的用户职业分布。在 本实施例中,统计同一个小区居住人员的所在的公司的信息,根据公司的类 型确定出居住人员的职业,从而可以统计出这个小区居住人员的职业的分布 情况,结合上表,可以看出这些公司场所基本上都是一些互联网、软件等企 业所在地,所以可以推测出这个小区居住人员很多从事互联网、软件等职业。

在本实施例的技术方案中,利用用户的定位信息获取用户的位置信息, 并进一步区分工作地信息和居住地信息;然后通过聚类对同一居住地信息的 多个用户进行聚类,即取得了某一地区的聚类用户的工作地信息;基于工作 地信息可以确定用户职业,从而得到该地区的工作的职业信息,以用于进行 职业分布的分析。

本发明的一个实施例提供一种判断聚类的用户职业分布方法,相比于前 述的实施例,本实施例的判断聚类的用户职业分布方法,步骤120,具体包括:

查询多个位置信息对应的场所,根据场所从多个位置信息中区分用户的 工作地信息和居住地信息。根据本实施例的技术方案,结合所做场所的类型 可知,居住地往往是小区类型,而工作地则多位于在商圈、写字楼等;基于 场所类型,可以准确判断工作地信息和居住地信息。

本发明的一个实施例提供一种判断聚类的用户职业分布方法,相比于前 述的实施例,本实施例的判断聚类的用户职业分布方法,步骤120,具体包括:

获取多个位置信息对应的定位时间,根据定位时间从多个位置信息中区 分用户的工作地信息和居住地信息。在本实施例中,如果一个用户在工作日 白天经常出现在某个地方,则往往是工作地的信息,如果一个用户在晚上经 常出现在某个地方,则往往为居住地的信息。

本发明的一个实施例提供一种判断聚类的用户职业分布方法,相比于前 述的实施例,本实施例的判断聚类的用户职业分布方法,步骤150,具体包括:

根据聚类的用户的工作地信息,查询位于聚类的用户的工作地的组织机 构,根据组织机构判断聚类的用户的职业。在本实施例中,例如,可以基于 现有的地图数据库,查询出位于工作地的组织机构,而组织机构的性质就反 映了用户所从事的职业。

本发明的一个实施例提供一种判断聚类的用户职业分布方法,相比于前 述的实施例,本实施例的判断聚类的用户职业分布方法,根据组织机构判断 聚类的用户的职业,具体包括:

在位于同一工作地的组织机构为多个时,统计多个组织机构中相同类型 的组织机构数量,并按最大组织机构数量对应的组织机构,确定对应用户的 职业。在本实施例中,如果某一写字楼有7家软件公司、2家传媒公司,则判 断用户职业为软件行业从业者。根据组织机构的数量进行判断,得到的用户 职业准确率更高。

如图2所示,本发明的一个实施例中提供了一种判断聚类的用户职业分 布装置,包括:

位置信息获取模块210,用于基于用户终端提供的定位信息,得到用户终 端所在的多个位置信息。在本实施例中,对定位方式不进行限制,例如:用 户携带的移动终端安装有GPS(全球定位系统)模块,则通过GPS模块可以 对用户进行定位,从而得到用户的位置信息。

区分模块220,用于从多个位置信息中区分工作地信息和居住地信息。在 本实施例中,通常每天用户所在的位置不是居住地就是工作地,所以从位置 信息中可区分出工作地信息和居住地信息;在本实施例中,对如何区分工作 信息和居住地信息的方式不进行限制,例如,根据位置信息查询对应的名称, 如果是“某某小区”则可以判断为居住地信息,如果是“某某写字楼”则可 以判断是工作地信息。

聚类模块230,用于对基于同一居住地信息的多个用户进行聚类。

统计模块240,用于统计聚类的多个用户的工作地信息。聚类结果可以如 下表所示:对于西二旗智学苑的用户进行聚类,得到聚类后的用户的工作地 信息,其中居住人员所在的公司按人数的多少排名。

职业分布判断模块250,用于根据聚类的用户的工作地信息,判断聚类的 用户职业分布。在本实施例中,统计同一个小区居住人员的所在的公司的信 息,根据公司的类型确定出居住人员的职业,从而可以统计出这个小区居住 人员的职业的分布情况,结合上表,可以看出这些公司场所基本上都是一些 互联网、软件等企业所在地,所以可以推测出这个小区居住人员很多从事互 联网、软件等职业。

在本实施例的技术方案中,利用用户的定位信息获取用户的位置信息, 并进一步区分工作地信息和居住地信息;然后通过聚类对同一居住地信息的 多个用户进行聚类,即取得了某一地区的聚类用户的工作地信息;基于工作 地信息可以确定用户职业,从而得到该地区的工作的职业信息,以用于进行 职业分布的分析。

本发明的一个实施例提供一种判断聚类的用户职业分布装置,相比于前 述的实施例,本实施例的判断聚类的用户职业分布装置,区分模块220查询 多个位置信息对应的场所,根据场所从多个位置信息中区分用户的工作地信 息和居住地信息。根据本实施例的技术方案,结合所做场所的类型可知,居 住地往往是小区类型,而工作地则多位于在商圈、写字楼等;基于场所类型, 可以准确判断工作地信息和居住地信息。

本发明的一个实施例提供一种判断聚类的用户职业分布装置,相比于前 述的实施例,本实施例的判断聚类的用户职业分布装置,区分模块220获取 多个位置信息对应的定位时间,根据定位时间从多个位置信息中区分用户的 工作地信息和居住地信息。在本实施例中,如果一个用户在工作日白天经常 出现在某个地方,则往往是工作地的信息,如果一个用户在晚上经常出现在 某个地方,则往往为居住地的信息。

本发明的一个实施例提供一种判断聚类的用户职业分布装置,相比于前 述的实施例,本实施例的判断聚类的用户职业分布装置,职业分布判断模块 250根据聚类的用户的工作地信息,查询位于聚类的用户的工作地的组织机构, 根据组织机构判断聚类的用户的职业。在本实施例中,例如,可以基于现有 的地图数据库,查询出位于工作地的组织机构,而组织机构的性质就反映了 用户所从事的职业。

本发明的一个实施例提供一种判断聚类的用户职业分布装置,相比于前 述的实施例,本实施例的判断聚类的用户职业分布装置,职业分布判断模块 250在位于同一工作地的组织机构为多个时,统计多个组织机构中相同类型的 组织机构数量,并按最大组织机构数量对应的组织机构,确定对应用户的职 业。在本实施例中,如果某一写字楼有7家软件公司、2家传媒公司,则判断 用户职业为软件行业从业者。根据组织机构的数量进行判断,得到的用户职 业准确率更高。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固 有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述, 构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定 编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容, 并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发 明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详 细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或 多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被 一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的 方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中 所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的 那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具 体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要 求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自 适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以 把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可 以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者 单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴 随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或 者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相 似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它 实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合 意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利 要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器 上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理 解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发 明实施例的判断聚类的用户职业分布装置中的一些或者全部部件的一些或者 全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全 部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实 现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个 信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上 提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并 且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施 例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求 的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元 件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借 助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列 举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬 件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可 将这些单词解释为名称。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号