首页> 中国专利> 一种地理区域的特征识别方法和装置

一种地理区域的特征识别方法和装置

摘要

本发明实施例提供了一种地理区域的特征识别方法和装置,该方法包括:接收第一终端提交的定位信息;所述定位信息中包括用户标识、地理坐标信息;分别查找所述用户标识对应的一个或多个用户属性信息、所述地理坐标信息所属的地理区域;所述地理区域具有关联的一个或多个区域属性信息,每个区域属性信息具有属性频次;增加与所述用户属性信息匹配的区域属性信息的属性频次;根据所述属性频次从所述一个或多个区域属性信息中选取一个或多个区域特征属性信息,以获得所述地理区域的特征。本发明实施例为业务对象的推送奠定基础,基于地理区域的功能对用户群体影响的特性,分析地理区域的特征可以大大提高用户群体的覆盖率。

著录项

  • 公开/公告号CN104778231A

    专利类型发明专利

  • 公开/公告日2015-07-15

    原文格式PDF

  • 申请/专利权人 北京奇艺世纪科技有限公司;

    申请/专利号CN201510149848.5

  • 发明设计人 张超;

    申请日2015-03-31

  • 分类号G06F17/30(20060101);

  • 代理机构11319 北京润泽恒知识产权代理有限公司;

  • 代理人赵娟

  • 地址 100080 北京市海淀区北一街2号鸿城拓展大厦10、11层

  • 入库时间 2023-12-18 09:52:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-09-11

    授权

    授权

  • 2015-08-12

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150331

    实质审查的生效

  • 2015-07-15

    公开

    公开

说明书

技术领域

本发明涉及计算机的技术领域,特别是涉及一种地理区域的特征识别方 法、一种地理区域的特征识别装置、一种基于地理区域的业务对象的推送方 法和一种基于地理区域的业务对象的推送装置。

背景技术

因特网Internet的迅猛发展将人们带入了信息社会和网络经济时代,对 企业的发展和个人生活都产生了深刻的影响。同时,过量的信息使得人们无 法高效地从中获取自己需要的部分,信息的使用效率反而降低。

显然,用户既不愿意花费太多时间在漫无边际的网上寻找业务对象,为 了提升用户粘度,许多平台都会推送一些业务对象给用户。

现在,某些平台通过分析用户的属性进行信息的推送,虽然准确度 还可接受,但是由于互联网的特性和相关技术的限制,能够被分析出属 性的用户群占所有覆盖用户的比例并不大。

这种以单个用户的属性为主的推送模式,推送的业务对象的覆盖率 低,仅能向少部分用户提供匹配用户需求的业务对象,而大部分用户获 得的是不匹配用户需求的业务对象,这些业务对象往往会被用户当作垃 圾信息或恶意行为进行拦截,十分影响用户的上网体验。

一方面,这些不匹配用户需求的业务对象不仅占用了平台服务器的资 源,而且还占用了客户端的资源,造成不必要的资源占用与浪费。另一方面, 用户需要获取自己感兴趣的业务对象,会再次在搜索引擎中搜索业务对象, 搜索引擎要再次进行海量信息的搜索、对比、筛选等获取相关的新闻信息的 信息,不仅用户操作更加繁琐,耗费用户的时间,而且将大大增加搜索引擎 的负担,耗费更多客户端与搜索引擎的资源。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至 少部分地解决上述问题的一种地理区域的特征识别方法、一种地理区域的特 征识别装置、一种基于地理区域的业务对象的推送方法和一种基于地理区域 的业务对象的推送装置。

为了解决上述问题,本发明实施例公开了一种地理区域的特征识别方 法,包括:

接收第一终端提交的定位信息;所述定位信息中包括用户标识、地理坐 标信息;

分别查找所述用户标识对应的一个或多个用户属性信息、所述地理坐标 信息所属的地理区域;所述地理区域具有关联的一个或多个区域属性信息, 每个区域属性信息具有属性频次;

增加与所述用户属性信息匹配的区域属性信息的属性频次;

根据所述属性频次从所述一个或多个区域属性信息中选取一个或多个 区域特征属性信息,以获得所述地理区域的特征。

优选地,所述增加所述用户属性信息匹配的区域属性信息的属性频次的 步骤包括:

对所述地理坐标信息进行有效停留筛选和/或停留去重处理,获得目标地 理坐标信息;

增加目标区域属性信息的属性频次,目标区域属性信息为与目标地理坐 标信息对应的用户属性信息,匹配的区域属性信息。

优选地,定位信息由第一终端间隔预设的第一时间段上传;

所述对所述地理坐标信息进行有效停留筛选和/或停留去重处理的步骤 包括:

计算所述定位信息中的地理坐标信息与上一定位信息中的地理坐标信 息之间的距离;

判断所述距离是否大于预设的距离阈值;

若是,则移除所述定位信息;若否,则保留所述定位信息。

优选地,所述对所述地理坐标信息进行有效停留筛选和/或停留去重处理 的步骤包括:

判断所述定位信息是否是属于所述地理区域的在预设的第二时间段内 的首个定位信息;

若是,则保留所述定位信息;若否,则移除所述定位信息。

优选地,所述根据所述属性频次从所述一个或多个区域属性信息中选取 一个或多个区域特征属性信息的步骤包括:

选取属性频次最高的一个或多个区域属性信息,作为区域特征属性信 息。

优选地,所述根据所述属性频次从所述一个或多个区域属性信息中选取 一个或多个区域特征属性信息的步骤包括:

选取属性频次超过预设频次阈值的一个或多个区域属性信息,作为区域 特征属性信息。

优选地,该方法还包括:

对所述一个或多个区域属性信息的属性频次,按照时间进行衰减。

优选地,所述地理区域按照人口密度分布信息和/或用户分布信息划分。

本发明实施例还公开了一种基于地理区域的业务对象的推送方法,包 括:

获取第二终端的地理坐标信息;

查找所述地理坐标信息所属的地理区域;所述地理区域具有一个或多个 区域特征属性信息;

获取所述一个或多个区域特征属性信息关联的一个或多个业务对象;

将所述一个或多个业务对象推送至所述第二终端;

其中,所述区域特征属性信息通过以下方式识别:

接收第一终端提交的定位信息;所述定位信息中包括用户标识、地理坐 标信息;

分别查找所述用户标识对应的一个或多个用户属性信息、所述地理坐标 信息所属的地理区域;所述地理区域具有关联的一个或多个区域属性信息, 每个区域属性信息具有属性频次;

增加与所述用户属性信息匹配的区域属性信息的属性频次;

根据所述属性频次从所述一个或多个区域属性信息中选取一个或多个 区域特征属性信息。

本发明实施例还公开了一种地理区域的特征识别装置,包括:

定位信息接收模块,用于接收第一终端提交的定位信息;所述定位信息 中包括用户标识、地理坐标信息;

信息查找模块,用于分别查找所述用户标识对应的一个或多个用户属性 信息、所述地理坐标信息所属的地理区域;所述地理区域具有关联的一个或 多个区域属性信息,每个区域属性信息具有属性频次;

属性频次增加模块,用于增加与所述用户属性信息匹配的区域属性信息 的属性频次;

区域特征属性信息选取模块,用于根据所述属性频次从所述一个或多个 区域属性信息中选取一个或多个区域特征属性信息,以获得所述地理区域的 特征。

优选地,所述属性频次增加模块包括:

筛选子模块,用于对所述地理坐标信息进行有效停留筛选和/或停留去重 处理,获得目标地理坐标信息;

增加子模块,用于增加目标区域属性信息的属性频次,目标区域属性信 息为与目标地理坐标信息对应的用户属性信息,匹配的区域属性信息。

优选地,定位信息由第一终端间隔预设的第一时间段上传;所述筛选子 模块包括:

距离计算子模块,用于计算所述定位信息中的地理坐标信息与上一定位 信息中的地理坐标信息之间的距离;

距离阈值判断子模块,用于判断所述距离是否大于预设的距离阈值;若 是,则调用第一移除子模块,若否,则调用第一保留子模块;

第一移除子模块,用于移除所述定位信息;

第一保留子模块,用于保留所述定位信息。

优选地,所述筛选子模块包括:

首个判断子模块,用于判断所述定位信息是否是属于所述地理区域的在 预设的第二时间段内的首个定位信息;若是,则调用第二保留子模块,若否, 则调用第二移除子模块;

第二保留子模块,用于保留所述定位信息;

第二移除子模块,用于移除所述定位信息。

优选地,所述区域特征属性信息选取模块包括:

第一选取子模块,用于选取属性频次最高的一个或多个区域属性信息, 作为区域特征属性信息。

优选地,所述区域特征属性信息选取模块包括:

第二选取子模块,用于选取属性频次超过预设频次阈值的一个或多个区 域属性信息,作为区域特征属性信息。

优选地,该装置还包括:

衰减模块,用于对所述一个或多个区域属性信息的属性频次,按照时间 进行衰减。

本发明实施例还公开了一种基于地理区域的业务对象的推送装置,包 括:

地理坐标信息获取模块,用于获取第二终端的地理坐标信息;

地理区域查找模块,用于查找所述地理坐标信息所属的地理区域;所述 地理区域具有一个或多个区域特征属性信息;

业务对象获取模块,用于获取所述一个或多个区域特征属性信息关联的 一个或多个业务对象;

业务对象推送模块,用于将所述一个或多个业务对象推送至所述第二终 端;

其中,所述区域特征属性信息通过调用以下模块识别:

定位信息接收模块,用于接收第一终端提交的定位信息;所述定位信息 中包括用户标识、地理坐标信息;

信息查找模块,用于分别查找所述用户标识对应的一个或多个用户属性 信息、所述地理坐标信息所属的地理区域;所述地理区域具有关联的一个或 多个区域属性信息,每个区域属性信息具有属性频次;

属性频次增加模块,用于增加与所述用户属性信息匹配的区域属性信息 的属性频次;

区域特征属性信息选取模块,用于根据所述属性频次从所述一个或多个 区域属性信息中选取一个或多个区域特征属性信息,以获得所述地理区域的 特征。

本发明实施例包括以下优点:

本发明实施例通过第一终端提交的定位信息进行聚类和特征提取,从地 理区域的区域属性信息中选取区域特征属性信息,作为地理区域的特征,为 业务对象的推送奠定基础,基于地理区域的功能对用户群体影响的特性,分 析地理区域的特征可以大大提高用户群体的覆盖率。

应用地理区域的特征进行业务对象的推送,业务对象更符合用户群体的 特性,从而可以提高推送业务对象的成功率,减少用户拦截业务对象的几率, 减少平台服务器和终端的资源浪费。

用户获得与自身属性匹配的业务对象,无需再手动搜索信息并进行过 滤,减少了获取所需业务对象的搜索、对比、筛选等操作,提高了获取业务 对象的效率,同时,由于用户的操作减少了,终端和各平台服务器的资源耗 费也降低了。

本发明实施例进行有效停留筛选和/或停留去重处理,减少无效信息的影 响,提高了识别特征的准确度。

本发明实施例对区域属性信息按照时间进行衰减属性频次,适应地理区 域的变迁对用户群体造成的影响,提高了识别的实用性。

附图说明

图1是本发明的一种地理区域的特征识别方法实施例的步骤流程图;

图2是本发明的一种地理区域的划分示例图;

图3是本发明的一种基于地理区域的用户群体分布示例图;

图4是本发明的一种地理区域的特征识别示例图;

图5是本发明的一种基于地理区域的业务对象的推送方法实施例的步骤 流程图;

图6是本发明的一种地理区域的特征识别装置实施例的结构框图;

图7是本发明的一种基于地理区域的业务对象的推送装置实施例的结构 框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图 和具体实施方式对本发明作进一步详细的说明。

参照图1,示出了本发明的一种地理区域的特征识别方法实施例的步骤 流程图,具体可以包括如下步骤:

步骤101,接收第一终端提交的定位信息;

需要说明的是,本发明实施例可以应用于服务器中,例如,云服务器、 应用服务器等等。

该服务器可以连接一个或多个终端(如第一终端、第二终端),该终端 可以包括固定设备,例如,个人电脑(Personal Computer,PC)、电视机等, 也可以包括移动设备,例如,手机、平板电脑、可穿戴设备(如手环、眼睛 等)等等,本发明实施例对此不加以限制。

在具体实现中,第一终端可以向上传上传定位信息,即服务器可以接收 第一终端提交的定位信息。

进一步而言,第一终端可以间隔预设的第一时间(如两小时、三小时) 上传的定位信息,也可以不定时上传定位信息,本发明实施例对此不加以限 制。

定位信息中可以包括用户标识、地理坐标信息;

其中,用户标识可以为表征一个唯一确定的用户的信息,例如,用户 账号、cookie、终端信息(如型号、终端识别码等)等等。

由于手机等终端一般为私人物品,通常只会有一名用户随身携带并使 用,因此,第一终端当前所在的位置(即地理坐标信息)可以表征当前用户 所在的位置。

在实际应用中,该地理坐标信息可以由第一终端通过卫星定位、基站定 位等方式获取。

其中,卫星定位的方式可以将第一终端的位置信号发送到定位后台来进 行定位,目前可使用的卫星定位系统包括GPS、GLONASS、北斗系统、Galileo 系统等等。

基站定位方式可以是利用通信运营商(如移动运营商、联通运营商、电 信运营商等)的基站对电子设备的距离的测算距离来确定电子设备的位置。

以GPS为例,所获得的GPS数据GPRMC的格式示例可以如下:

$GPRMC,<1>,<2>,<3>,<4>,<5>,<6>,<7>,<8>,<9>,<10>,<11>,<12>;

其中,字段<1>为标准定位时间(UTC time),其格式可以为:时时分分 秒秒.秒秒秒(hhmmss.sss);

字段<2>为定位状态,包括A=数据可用,V=数据不可用;

字段<3>为纬度,其格式可以为:度度分分.分分分分(ddmm.mmmm);

字段<4>为纬度区分,包括北半球(N)或南半球(S);

字段<5>为经度,其格式可以为:度度分分.分分分分;

字段<6>为经度区分,包括东(E)半球或西(W)半球;

字段<7>为相对位移速度,包括0.0至1851.8knots;

字段<8>为相对位移方向,包括000.0至359.9度;

字段<9>为日期,其格式可以为:日日月月年年(ddmmyy);

字段<10>为磁偏角,包括000.0°~180.0°;

字段<11>为磁偏角方向,包括E(东)或W(西);

字段<12>为Checksum(检查位)。

在本示例中,纬度、纬度区分、经度和经度区分可以确定地理信息位置。

定位信息的示例可以如下表所示:

PeopleID GeoPoint DeviceID 1 (10.5,127.6) AndroidPhone 2 (10.3,127.5) AndroidPhone 2 (10.5,127.6) AndroidPhone

其中,PeopleID是用户账号、GeoPoint是地理坐标信息、DeviceID是终 端信息。

步骤102,分别查找所述用户标识对应的一个或多个用户属性信息、所 述地理坐标信息所属的地理区域;

应用本发明实施例,可以预先采集用户的用户属性信息,建立用户标识 与用户属性信息的关联关系。

用户属性信息可以为表征用户属性的信息,例如,“白领”、“学生”、“体 育爱好者”等等。

用户标识与用户属性信息的关联关系的示例可以如下表所示:

PeopleID Profiles 1 白领,金融业,女性 2 学生,男性,体育爱好者

在一种方式中,可以由用户在注册时填写的用户信息(如姓名、地址、 简介等)中,或者,其他用户对该用户打上的标签(如“吃货”、“电影达人” 等)中,提取用户属性信息。

在另一种方式中,可以采集用户的行为信息,从行为信息中学习用户属 性信息。

例如,分析某个用户近期浏览视频的行为信息,该用户浏览了动漫100 集,浏览了新闻10集,浏览了综艺节目150集,浏览动漫和综艺节目的频 次相对较高,因此可以学习到该用户的用户属性信息为“动漫”、“综艺节目”。

应用本发明实施例,可以预先对各区域进行划分,划分出一个或多个地 理区域。

在实际应用中,地理区域可以按照人口密度分布信息和/或用户分布信息 划分,将地理区域按照实际业务的不同精细度需要划分为,如图2所示的50 米~10公里等边长的正方形。

在一种情况中,人口密度较为密集的地区,地理区域划分的精度较高, 反之,人口密度较为稀疏的地区,地理区域划分的精度较低。

例如,北京的西单地区比香山地区的地理区域划分的精度较高,中国的 东部沿海地区比西部山区的地理区域划分的精度较高。

在另一种情况中,用户密度较为密集的地区,地理区域划分的精度较高, 反之,用户密度较为稀疏的地区,地理区域划分的精度较低。

例如,城市地区比乡镇地区的地理区域划分的精度较高。

当然,还可以基于对具体的地理区域的精细度的需求程度划分地理区 域,本发明实施例对此不加以限制。

此外,地理区域还可以划分为其他形状,例如,正三角形、平行四边形、 正六边形等等,本发明实施例对此不加以限制。

但是从空间计算的复杂度和数据量存储的空间消耗的维度上来说,正方 形是比较合适的图形。

本发明实施例可以借助空间数据库或者自定义数据结构来存储地理区 域,其一般的存储结构类似于:(id,左上角坐标[经纬度或者映射好的数组索 引],边长)。

地理区域的划分可以有两种方式,基础都可以基于经纬度的。

在一种方式中,可以直接按照经纬度来划分,其示例可以如下表所示:

BlockID GeoInfo 1 [(10.5,127.6),(10.6,127.7)] 2 [(10.6,127.6),(10.7,127.7)]

其中,BlockID是地理区域的ID,GeoInfo是地理区域的范围。

在另一种方式中,可以设置一个基于经纬度的原点,然后按照边长(单 位长度)来映射将距离格子的长度单位到一个数组里面。例如,整个分析范 围内的左上角坐标为10.1,137.2,单位长度为1°,那么10.1,137.2至 20.1,147.2这个范围内就可以分成100个格子(地理区域),每个格子(地理 区域)可以用一个二维数组的索引来表示,比如格子(地理区域)[1,1]的范 围就是10.1,137.2至11.1,138.2。

当然,上述划分方式只是作为示例,在实施本发明实施例时,可以根据 实际情况设置其他划分方式,本发明实施例对此不加以限制。另外,除了上 述划分方式外,本领域技术人员还可以根据实际需要采用其它划分方式,本 发明实施例对此也不加以限制。

本发明实施例中,可以通过空间运算(基本原理就是通过地理坐标信息 的经纬度与地理区域的边界值进行比较),得到地理坐标信息所属的地理区 域。

地理区域可以具有关联的一个或多个区域属性信息,每个区域属性信息 可以具有属性频次;

区域属性信息可以为表征地理区域中用户群体属性的信息,例如,“白 领”、“学生”、“体育爱好者”等等。

区域属性信息的属性频次可以由该地理区域中用户群体通过终端进行 累积。

最终,可以以如下表格对数据进行存储:

其中,BlockID是地理区域的ID,GeoInfo是地理区域的范围,userProfile 是区域属性信息,count是属性频次。

步骤103,增加与所述用户属性信息匹配的区域属性信息的属性频次;

在具体实现中,可以根据预设的匹配规则对用户属性信息与区域属性信 息进行匹配。

该预设的匹配规则可以是自然语言处理分析规则,或者,可以也是正则 表达式规则,或者,也是二者的结合。

其中,自然语言处理分析规则大致分为两个层面,一个是浅层分析,如 分词,词性标注,通常只需对句子的局部范围进行分析处理;另一个层面是 对语言进行深层的处理,需要对句子进行全局分析,在分析时通常对句法、 语义以及语用这三个层次进行分析。

正则表达式规则一般是通过一些具有特定含义的字符来表示匹配规则 的,例如,字符“^”匹配一个输入或一行的开头,如“^a”匹配“an A”, 而不匹配“An a”;字符“$”匹配一个输入或一行的结尾,如“a$”匹配 “An a”,而不匹配“an A”;字符“*”匹配前面元字符0次或多次,如“ba*” 将匹配“b”,“ba”,“baa”以及“baaa”等。

通常情况下,自然语言处理分析规则主要用来解决同义词的问题,正则 表达式规则主要用来处理长尾词。另外,还自定义一些匹配规则。

通过匹配规则的设置,准确地确定与用户属性信息匹配的区域属性信 息,而且,当用户属性信息与区域属性信息有少许偏差,例如,第二搜索对 象中有某些字不同(如“动漫达人”与“动漫爱好者”),这时,根据自然语 言处理分析规则,仍然确定出匹配的用户属性信息与区域属性信息。

需要说明的是,若当前未有与用户属性信息匹配的区域属性信息,则可 以以该用户属性信息作为新的区域属性信息进行累积。

在本发明的一种优选实施例中,步骤103可以包括如下子步骤:

子步骤S11,对所述地理坐标信息进行有效停留筛选和/或停留去重处 理,获得目标地理坐标信息;

在实际应用中,连接多个定位信息中的地理坐标信息,可以获取用户的 活动轨迹和停留地点和停留时间。

有效停留筛选,可以为对地理坐标信息进行停留地点有效性的筛选,停 留地点无效,则移除该定位信息,停留地点有效,则保留该定位信息。

停留去重处理,可以为对地理坐标信息进行停留地点的去重处理,移除 重复的定位信息、保留不重复的定位信息。

通常情况下,用户有停留的地方才有是有意义的。

例如,用户在通州的家中住一晚上,第二天上路花了2个小时,到达了 金融街的单位中,下午下班后花费1小时到达三里屯酒吧,在酒吧停留2小 时后回家。

在本示例中,通州、金融街、三里屯这三个地点是有效的停留地点,在 上班、下班和回家的路上并未停留。

本发明实施例中,可以丢弃掉用户未停留的定位信息,将用户连续停留 的定位信息合并(去重)为一个有效停留。

如图3所示,人形代表某些用户群体,从地图宏观上看,用户群体由于 工作、学习等原因,可以在相应功能的地理区域聚集,如行政区域上的重点 商圈、办公楼群、住宅群,也可能是意料外的用户群体聚集区域。

在本发明的一种优选实施例中,定位信息可以由第一终端间隔预设的第 一时间段上传,即隔一段时间发送一次定位信息,频率可以在10分钟至4 小时之间,可以需要根据采集到的数据情况来确定,甚至可以动态调整,本 发明实施例对此不加以限制。

间隔一段时间发送一次定位信息,可以能够实时的获取用户的活动轨迹 和停留地点和停留时间。

则在本发明实施例中,子步骤S11进一步可以包括如下子步骤:

子步骤S111,计算所述定位信息中的地理坐标信息与上一定位信息中的 地理坐标信息之间的距离;

子步骤S112,判断所述距离是否大于预设的距离阈值;若是,则执行子 步骤S113,若否,则执行子步骤S114;

子步骤S113,移除所述定位信息;

子步骤S114,保留所述定位信息。

一般情况下,用户在某个地点停留,其移动距离一般不会过大,反之, 用户路过某个地点,则其移动距离可能比较大。

例如,某个用户在某个办公楼群的单位上班,其在上班时间,移动距离 一般在这个办公楼群的范围内。而另一个用户搭乘公交经过这个办公楼群, 很快就随着公交离开很有的距离。

在本发明的一种优选实施例中,子步骤S11进一步可以包括如下子步骤:

子步骤S115,判断所述定位信息是否是属于所述地理区域的在预设的第 二时间段内的首个定位信息;若是,则执行子步骤S116,若否,则执行子步 骤S117;

子步骤S116,保留所述定位信息;

子步骤S117,移除所述定位信息。

在本发明实施例中,可以在一个指定的时间段(即第二时间段,如一天) 内累积一次某个地理区域的属性频次,若是首个定位信息,则可以进行累积, 若不是首个定位信息(如在某个单位上班期间发送多个定位信息),则可以 不进行累积(即去重)。

子步骤S12,增加目标区域属性信息的属性频次,目标区域属性信息为 与目标地理坐标信息对应的用户属性信息,匹配的区域属性信息。

在进行有效停留筛选、停留去重处理之后,则可以进行区域属性信息的 属性频次的累积(值加一),如,A1[a]=A1[a]+1、A1[b]=A1[b]+1,A1[a]和 A1[b]为区域属性信息。

步骤104,根据所述属性频次从所述一个或多个区域属性信息中选取一 个或多个区域特征属性信息,以获得所述地理区域的特征。

在具体实现中,可以以某些比较重要的属性作为地理区域的特征。

例如,在海淀区(地理区域)较多高校,学生较多,可以“学生”(区 域属性信息)作为特征;在中关村(地理区域)较多电子商店、科技公司, 程序员较多,可以“程序员”(区域属性信息)作为特征。

如图4所示,通过识别出地理区域的特征,则可以形成不同的用户群体 聚集的范围。

在本发明的一种优选实施例中,步骤104可以包括如下子步骤:

子步骤S21,选取属性频次最高的一个或多个区域属性信息,作为区域 特征属性信息。

在本发明实施例中,针对某些用户群体比较集中的地理区域等情况,可 以以属性频次最高的一个或多个区域属性信息作为区域特征属性信息。

在本发明的一种优选实施例中,步骤104可以包括如下子步骤:

子步骤S22,选取属性频次超过预设频次阈值的一个或多个区域属性信 息,作为区域特征属性信息。

在本发明实施例中,针对某些用户群体比较稀疏的地理区域等情况,可 以以属性频次超过预设频次阈值的一个或多个区域属性信息作为区域特征 属性信息。

当然,上述选取方式只是作为示例,在实施本发明实施例时,可以根据 实际情况设置其他选取方式,本发明实施例对此不加以限制。另外,除了上 述选取方式外,本领域技术人员还可以根据实际需要采用其它选取方式,本 发明实施例对此也不加以限制。

在本发明的一种优选实施例中,该方法还可以包括如下步骤:

步骤105,对所述一个或多个区域属性信息的属性频次,按照时间进行 衰减。

地理区域在不断变迁,如拆迁、城中村改造等,而地理区域功能的变换 对于用户群体有着比较大的影响,如某个养老院在先老人居多,在拆迁以后 兴建购物中心,则这个地理区域的老人的数量可能瞬间下降,而年轻人的数 量可能不断上升。

在本发明实施例中,可以对属性频次按照时间进行衰减,如每隔一个月 减少1000等,以适应地理区域的功能转变。

若地理区域的功能并未转变,则这个地理区域的用户群体大体稳定,属 性频次也大体稳定,衰减并不会造成太大的影响。

若地理区域的功能转变,则这个地理区域的用户群体可能会发生较大变 化,属性频次在此期间波动较大,对属性频次的衰减可以减少在先的属性信 息的属性频次,后续增加的属性信息的属性频次不断累积,可以超过在先属 性信息的属性频次,重新体现转变功能后的地理区域的特征。

参照图5,示出了本发明的一种基于地理区域的业务对象的推送方法实 施例的步骤流程图,具体可以包括如下步骤:

步骤501,获取第二终端的地理坐标信息;

步骤502,查找所述地理坐标信息所属的地理区域;所述地理区域具有 一个或多个区域特征属性信息;

步骤503,获取所述一个或多个区域特征属性信息关联的一个或多个业 务对象;

步骤504,将所述一个或多个业务对象推送至所述第二终端;

在具体实现中,可以离线采用定位信息识别出地理区域的区域特征属性 信息,而区域特征属性信息可以关联业务对象,获取第二终端的地理坐标信 息后可以直接获取业务对象进行推送。

对于不同业务领域而言,可以具有不同的业务对象,即具有业务领域特 征的对象。

例如,对于半导体领域而言,业务对象可以包括物料(如硅片);对于 新闻媒体领域而言,业务对象可以包括新闻数据;对于移动通讯领域而言, 业务对象可以包括移动通讯数据;对于视频领域而言,业务对象可以包括视 频、广告,等等。

业务对象虽然可以承载不同的业务特性,但其实质仍可以是数据,例如, 文本、图片、音频、视频等等。

在具体实现中,本发明实施例还可以依据预设的时间规则对收集到的定 位信息进行聚类和特征提取,以识别区域特征属性信息。

其中,时间规则可由本领域技术人员根据实际情况进行设定,例如,可 以是定期或不定期对全部或部分定位信息进行聚类和特征提取,部分定位信 息可以是一段或多段时间内收集的定位信息,本发明实施例对此不加以限 制。

在具体实现中,所述区域特征属性信息可以通过以下方式识别:

步骤S31,接收第一终端提交的定位信息;所述定位信息中包括用户标 识、地理坐标信息;

步骤S32,分别查找所述用户标识对应的一个或多个用户属性信息、所 述地理坐标信息所属的地理区域;

其中,所述地理区域具有关联的一个或多个区域属性信息,每个区域属 性信息具有属性频次;

步骤S33,增加与所述用户属性信息匹配的区域属性信息的属性频次;

步骤S34,根据所述属性频次从所述一个或多个区域属性信息中选取一 个或多个区域特征属性信息。

在本发明的一种优选实施例中,步骤S33可以包括如下子步骤:

子步骤S331,对所述地理坐标信息进行有效停留筛选和/或停留去重处 理,获得目标地理坐标信息;

子步骤S332,增加目标区域属性信息的属性频次,目标区域属性信息 为与目标地理坐标信息对应的用户属性信息,匹配的区域属性信息。

在本发明的一种优选实施例中,定位信息可以由第一终端间隔预设的第 一时间段上传;

子步骤S331可以包括如下子步骤:

子步骤S3311,计算所述定位信息中的地理坐标信息与上一定位信息中 的地理坐标信息之间的距离;

子步骤S3312,判断所述距离是否大于预设的距离阈值;若是,则执行 子步骤S3313,若否,则执行子步骤S3314;

子步骤S3313,移除所述定位信息;

子步骤S3314,保留所述定位信息。

在本发明的一种优选实施例中,子步骤S331可以包括如下子步骤:

子步骤S3315,判断所述定位信息是否是属于所述地理区域的在预设的 第二时间段内的首个定位信息;若是,则执行子步骤S3316,若否,则执行 子步骤S3317;

子步骤S3316,保留所述定位信息;

子步骤S3317,移除所述定位信息。

在本发明的一种优选实施例中,步骤S34可以包括如下子步骤:

选取属性频次最高的一个或多个区域属性信息,作为区域特征属性信 息。

在本发明的一种优选实施例中,步骤S34可以包括如下子步骤:

选取属性频次超过预设频次阈值的一个或多个区域属性信息,作为区域 特征属性信息。

在本发明的一种优选实施例中,所述区域特征属性信息还可以通过以下 方式识别:

步骤S35,对所述一个或多个区域属性信息的属性频次,按照时间进行 衰减。

在具体实现中,所述地理区域可以按照人口密度分布信息和/或用户分布 信息划分。

对于本发明实施例而言,由于区域特征属性信息的识别方法实施例与地 理区域的特征识别方法实施例基本相似,本发明实施例在此不再详述,相关 之处参见地理区域的特征识别方法实施例的部分说明即可。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系 列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述 的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或 者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例 均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图6,示出了本发明的一种地理区域的特征识别装置实施例的结构 框图,具体可以包括如下模块:

定位信息接收模块601,用于接收第一终端提交的定位信息;所述定位 信息中包括用户标识、地理坐标信息;

信息查找模块602,用于分别查找所述用户标识对应的一个或多个用户 属性信息、所述地理坐标信息所属的地理区域;所述地理区域具有关联的一 个或多个区域属性信息,每个区域属性信息具有属性频次;

属性频次增加模块603,用于增加与所述用户属性信息匹配的区域属性 信息的属性频次;

区域特征属性信息选取模块604,用于根据所述属性频次从所述一个或 多个区域属性信息中选取一个或多个区域特征属性信息,以获得所述地理区 域的特征。

在本发明的一种优选实施例中,所述属性频次增加模块603可以包括如 下子模块:

筛选子模块,用于对所述地理坐标信息进行有效停留筛选和/或停留去重 处理,获得目标地理坐标信息;

增加子模块,用于增加目标区域属性信息的属性频次,目标区域属性信 息为与目标地理坐标信息对应的用户属性信息,匹配的区域属性信息。

在本发明的一种优选实施例中,定位信息由第一终端间隔预设的第一时 间段上传;所述筛选子模块可以包括如下子模块:

距离计算子模块,用于计算所述定位信息中的地理坐标信息与上一定位 信息中的地理坐标信息之间的距离;

距离阈值判断子模块,用于判断所述距离是否大于预设的距离阈值;若 是,则调用第一移除子模块,若否,则调用第一保留子模块;

第一移除子模块,用于移除所述定位信息;

第一保留子模块,用于保留所述定位信息。

在本发明的一种优选实施例中,所述筛选子模块可以包括如下子模块:

首个判断子模块,用于判断所述定位信息是否是属于所述地理区域的在 预设的第二时间段内的首个定位信息;若是,则调用第二保留子模块,若否, 则调用第二移除子模块;

第二保留子模块,用于保留所述定位信息;

第二移除子模块,用于移除所述定位信息。

在本发明的一种优选实施例中,所述区域特征属性信息选取模块604可 以包括如下子模块:

第一选取子模块,用于选取属性频次最高的一个或多个区域属性信息, 作为区域特征属性信息。

在本发明的一种优选实施例中,所述区域特征属性信息选取模块604可 以包括如下子模块:

第二选取子模块,用于选取属性频次超过预设频次阈值的一个或多个区 域属性信息,作为区域特征属性信息。

在本发明的一种优选实施例中,该装置还可以包括如下模块:

衰减模块,用于对所述一个或多个区域属性信息的属性频次,按照时间 进行衰减。

在具体实现中,所述地理区域可以按照人口密度分布信息和/或用户分布 信息划分。

参照图7,示出了本发明的一种基于地理区域的业务对象的推送装置实 施例的结构框图,具体可以包括如下模块:

地理坐标信息获取模块701,用于获取第二终端的地理坐标信息;

地理区域查找模块702,用于查找所述地理坐标信息所属的地理区域; 所述地理区域具有一个或多个区域特征属性信息;

业务对象获取模块703,用于获取所述一个或多个区域特征属性信息关 联的一个或多个业务对象;

业务对象推送模块704,用于将所述一个或多个业务对象推送至所述第 二终端;

其中,所述区域特征属性信息可以通过调用以下模块识别:

定位信息接收模块,用于接收第一终端提交的定位信息;所述定位信息 中包括用户标识、地理坐标信息;

信息查找模块,用于分别查找所述用户标识对应的一个或多个用户属性 信息、所述地理坐标信息所属的地理区域;所述地理区域具有关联的一个或 多个区域属性信息,每个区域属性信息具有属性频次;

属性频次增加模块,用于增加与所述用户属性信息匹配的区域属性信息 的属性频次;

区域特征属性信息选取模块,用于根据所述属性频次从所述一个或多个 区域属性信息中选取一个或多个区域特征属性信息,以获得所述地理区域的 特征。

在本发明的一种优选实施例中,所述属性频次增加模块可以包括如下子 模块:

筛选子模块,用于对所述地理坐标信息进行有效停留筛选和/或停留去重 处理,获得目标地理坐标信息;

增加子模块,用于增加目标区域属性信息的属性频次,目标区域属性信 息为与目标地理坐标信息对应的用户属性信息,匹配的区域属性信息。

在本发明的一种优选实施例中,定位信息由第一终端间隔预设的第一时 间段上传;所述筛选子模块可以包括如下子模块:

距离计算子模块,用于计算所述定位信息中的地理坐标信息与上一定位 信息中的地理坐标信息之间的距离;

距离阈值判断子模块,用于判断所述距离是否大于预设的距离阈值;若 是,则调用第一移除子模块,若否,则调用第一保留子模块;

第一移除子模块,用于移除所述定位信息;

第一保留子模块,用于保留所述定位信息。

在本发明的一种优选实施例中,所述筛选子模块可以包括如下子模块:

首个判断子模块,用于判断所述定位信息是否是属于所述地理区域的在 预设的第二时间段内的首个定位信息;若是,则调用第二保留子模块,若否, 则调用第二移除子模块;

第二保留子模块,用于保留所述定位信息;

第二移除子模块,用于移除所述定位信息。

在本发明的一种优选实施例中,所述区域特征属性信息选取模块可以包 括如下子模块:

第一选取子模块,用于选取属性频次最高的一个或多个区域属性信息, 作为区域特征属性信息。

在本发明的一种优选实施例中,所述区域特征属性信息选取模块可以包 括如下子模块:

第二选取子模块,用于选取属性频次超过预设频次阈值的一个或多个区 域属性信息,作为区域特征属性信息。

在本发明的一种优选实施例中,所述区域特征属性信息还可以通过调用 以下模块识别:

衰减模块,用于对所述一个或多个区域属性信息的属性频次,按照时间 进行衰减。

在具体实现中,所述地理区域可以按照人口密度分布信息和/或用户分布 信息划分。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较 简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明 的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见 即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装 置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全 软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例 可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介 质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程 序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计 算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令 实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框 图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、 专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生 一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的 指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理 终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读 存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设 备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计 算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用 于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中 指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦 得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以, 所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所 有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语 仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求 或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术 语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得 包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且 还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或 者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一 个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终 端设备中还存在另外的相同要素。

以上对本发明所提供的一种地理区域的特征识别方法、一种地理区域的 特征识别装置、一种基于地理区域的业务对象的推送方法和一种基于地理区 域的业务对象的推送装置,进行了详细介绍,本文中应用了具体个例对本发 明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发 明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的 思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书 内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号