首页> 中国专利> 与地理特征相关的个性化位置推荐系统

与地理特征相关的个性化位置推荐系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种与地理特征相关的个性化位置推荐系统，主要解决现有协同过滤推荐算法在数据稀疏场景中性能差的不足。其技术方案是通过不同的功能模块相互协调实现推荐：数据库获取模块获取目标信息；用户数据库模块将目标信息存储在用户数据库中；用户偏好挖掘模块从用户数据库获取按照用户偏好排序的候选位置推荐列表；地理数据库模块将目标信息存储在地理数据库中；地理特征挖掘模块从地理数据库中获得按照地理特征排序的候选位置推荐列表；推荐模块使用按照用户偏好排序的推荐列表和按照地理特征影响排序的推荐列表，获得推荐结果。本发明通过考虑地理特征，缓解了数据的稀疏性问题，可用于基于位置社交网络的地点推送服务中。

著录项

公开/公告号CN105718576A

专利类型发明专利
公开/公告日2016-06-29

原文格式PDF
申请/专利权人西安电子科技大学;
展开▼

申请/专利号CN201610044328.2
发明设计人朱晓妍;郝日佩;池浩田;裴庆祺;
展开▼

申请日2016-01-22
分类号G06F17/30(20060101);
代理机构61205 陕西电子工业专利中心;
代理人王品华;朱红星
地址 710071 陕西省西安市太白南路2号
入库时间 2023-12-18 15:45:39

法律信息

法律状态公告日

法律状态信息

法律状态
2019-07-16

授权

授权
2016-07-27

实质审查的生效 IPC(主分类):G06F17/30 申请日:20160122

实质审查的生效
2016-06-29

公开

公开

说明书

技术领域

本发明属于数据处理技术领域，特别涉及一种与地理特征相关的个性化推荐技术，可用于基于位置社交网络中的地点推送服务。

背景技术

伴随着数据库技术的迅速发展和数据库管理系统的广泛应用，数据积累的越来越多。面对激增的数据，人们希望能够挖掘出隐藏在背后的许多重要的信息，从而可以更好地利用这些数据为人们服务。服务提供商拥有海量的与用户有关的个人信息和历史记录，利用这些数据向用户主动推荐相关服务既可以方便用户，又有益于服务提供商。

传统的推荐系统算法主要使用的是基于协同过滤的推荐算法，基于内容的推荐算法。无线网络和位置感知技术的出现和进步，推动着移动互联网，尤其是基于位置的社交网络的蓬勃发展，用户的地理位置数据通过客户端GPS开始被大量获取。地理上下文开始成为位置推荐的重要特征属性，使得一些基于用户地理位置的商品推荐任务成为可能。

在收集到用户的地理位置数据后，需要先对用户在地理位置上进行划分，划分方法是基于用户签到位置所在地的经度和纬度为基础的划分方法。然后，通过扫描该地区所有用户的位置历史记录以及待推荐用户的所有历史记录，通过预设模型计算用户和地区对位置的预测分数，进而获得候选位置，进行基于模型的协同过滤的推荐计算。

当前已有的基于协同过滤的推荐计算方案中，一种是基于用户本身之间的相似程度，一种是基于物品本身之间的相似程度。

上述方法中，由于均没有考虑地理特征在为用户进行地点推荐的影响，因而在数据稀疏场景中，如异地位置推荐，性能表现很差，而且对于新用户和新物品的冷启动问题，也无法有效解决。

发明内容

本发明的目的在于针对以上方法的不足，提出了一种与地理特征相关的个性化位置推荐系统，结合位置类别以及地理特征，使用潜在狄利克雷分配主题模型，为用户提供有感兴趣的位置。

为实现上述目的，本发明的推荐系统包括：

数据获取模块DC，用于抓取目标网站用户的签到记录，为用户数据库模块UD和地理数据库模块DD提供数据；

用户数据库模块UD，用于将数据抓取模块DC抓取的全部信息以用户ID作为索引存储在用户数据库中，为用户偏好挖掘模块UM提供用户信息；

地理数据库模块DD，用于将数据抓取模块DC抓取的全部信息以地理城市作为索引存储在地理数据库中，为地理特征挖掘模块DM提供地理信息；

用户偏好挖掘模块UM，用于使用用户数据库模块UD中的数据去挖掘用户的偏好，得到按照用户偏好排序的候选位置推荐列表List₁；

地理特征挖掘模块DM，用于使用地理数据库模块DD中的数据挖掘地理特征，得到按照地理特征影响排序的候选位置推荐列表List₂；

推荐模块RD，用于根据按照用户偏好排序的候选位置推荐列表List₁和按照地理特征影响排序的候选位置推荐列表List₂，产生最终的推荐结果Result。

本发明的优点是：

本发明通过用户偏好挖掘模块学习用户的个人兴趣，从而实现了个性化的位置推荐；

本发明通过地理特征挖掘模块综合地理特征影响，从而缓解了数据的稀疏性问题，尤其是异地位置推荐问题。

附图说明

图1是本发明的推荐系统整体框架图；

图2是本发明中用户偏好挖掘模块框架图；

图3是本发明中地理特征挖掘模块框架图；

图4是本发明中推荐模块框架图。

以下结合附图对本发明的实施例和效果进行详细描述。

具体实施方案

本发明的核心思想是考虑地理特征的影响，结合位置类别，使用潜在狄利克雷分配主题模型，提出了一种与地理特征相关的个性化位置推荐系统，为用户提供感兴趣的位置。

参照图1，本发明包括：数据获取模块DC，用户数据库模块UD，地理数据库模块DD，用户偏好挖掘模块UM，地理特征挖掘模块DM和推荐模块RD。其中，数据获取模块DC，用于抓取目标网站用户的签到记录，为用户数据库模块UD和地理数据库模块DD提供数据；用户数据库模块UD，用于将数据获取模块DC获取的全部信息以用户ID作为索引存储在用户数据库中，为用户偏好挖掘模块UM提供用户信息；用户偏好挖掘模块UM，使用用户数据库模块DC中的用户签到记录，挖掘待推荐用户的偏好，得到按照用户偏好排序的候选位置推荐列表List₁；地理数据库模块DD，用于将数据获取模块DC获取的全部信息以地理城市作为索引存储在地理数据库中，为地理特征挖掘模块DM提供地理信息；地理特征挖掘模块DM使用地理数据库模块DD中不同地理城市包括的用户签到记录，挖掘待推荐城市的地理特征，得到按照地理特征影响排序的候选位置推荐列表List₂；推荐模块RD使用用户偏好挖掘模块UM得到的推荐列表List₁和地理特征挖掘模块DM得到的推荐列表List₂，获得最终的推荐结果。

所述的数据获取模块DC，获取目标网站用户的签到记录，其中，签到记录包括：用户ID，语义位置，如大唐芙蓉园，语义位置的类别，如旅游&交通和语义位置所在地理城市，如西安。其中，语义位置的类别包括：艺术&娱乐，学院&大学，活动，食品店，夜市，户外&休闲，居民区，商店&服务和旅游&交通。

参照图2，所述的用户偏好挖掘模块UM，包括：主题模型训练单元UM₁，三层图模型构建单元UM₂和位置偏好值计算单元UM₃。

该主题模型训练单元UM₁，用于根据用户数据库模块UD得到的用户签到记录与主题，生成每个用户对应于每个主题的主题特征向量UV；

该三层图模型构建单元UM₂，用于根据用户数据库模块UD得到的用户签到记录与主题模型训练单元UM₁得到的主题特征向量UV，构建由所有用户、所有位置和所有主题组成的用户层、位置层和主题层的三层图结构；

该位置偏好值计算单元UM₃，用于根据用户层、位置层和主题层这三层图结构，得到用户数据库中用户‐主题概率分布的先验知识和主题‐位置概率分布的先验知识β_v，计算用户对未访问位置的偏好值f_uv，其中，用户对未访问位置的偏好值f_uv，通过下式计算：

其中，表示用户u对主题z_k的偏好程度的估计，表示对用户数据库中位置v在主题z_k中的生成概率的估计，表示主题z_k在用户u签到记录中被采样的次数，表示在用户u签到记录中位置v在主题z_k中被采样的次数，下标表示不包括主题i，R_r表示用户u签到记录中包含的主题数；

使用用户对位置的偏好值f_uv，对未访问位置进行递减排序,选取前k个位置生成按照用户偏好排序的候选位置推荐列表List₁。

参照图3，所述的地理特征挖掘模块DM，包括：主题模型训练单元DM₁，三层图模型构建单元DM₂和位置偏好值计算单元DM₃。

该主题模型训练单元DM₁，用于读取地理数据库模块DD包含的地理城市中所有用户的签到记录，根据记录中的主题，生成每个位置对应于每个主题的主题特征向量DV；

该三层图模型构建单元DM₂，用于根据地理数据库模块DD包含的地理城市中所有用户的签到记录以及主题模型训练模块DM₁得到的主题特征向量DV，构建由所有城市，所有位置和所有主题组成的地理层，位置层和主题层的三层图结构；

该位置偏好值计算单元DM₃，用于根据地理层，位置层和主题层这三层图结构，得到地理数据库中地理城市‐主题概率分布的先验知识和主题‐位置概率分布的先验知识β′_v，计算地理城市对位置的偏好值f_lv′，其中，地理城市对位置的偏好值f_lv′，通过下式计算：

其中，表示地理城市l对主题z_k的偏好程度的估计，表示对地理数据库中位置v在主题z_k中的生成概率的估计，表示主题z_k在地理城市l的所有的签到记录里被采样的次数，表示位置v在主题z_k中被采样的次数，下标表示不包括主题i，R_l表示地理城市l的所有签到记录中包含的主题数目，|V|表示地理城市l的所有签到记录中包含的位置数目。

使用地理城市对位置的偏好值f_lv′，对位置进行递减排序,选取前k个位置，形成按照地理特征影响排序的候选位置推荐列表List₂。

参照图4，所述的推荐模块RD，包括：加权系数计算子模块RD₁和位置推荐子模块RD₂。

该加权系数计算子模块RD₁，用于计算相对标准方差公式计算用户的个人偏好在用户做决定时所占的加权值ω_u，以及地理影响在用户做决定时所占的加权值ω_l，其计算公式如下：

其中，表示用户u偏好的平均值，P_u表示用户u的签到记录，表示用户u的签到记录包含的位置集合，表示用户u的签到记录包含的主题集合，表示地理城市l偏好的平均值，P_l表示地理城市l中所有用户的签到记录，表示地理城市l中所有用户的签到记录包含的位置集合，表示地理城市l中所有用户的签到记录包含的主题集合。

该位置推荐子模块RD₂，用于计算所述两个推荐列表List₁和List₂中位置的加权值R：

R＝λ_uf_uv+λ_lf′_lv，

其中，表示对用户个人偏好在作决定中所占权重归一化，表示对地理特征在用户作决定中所占权重归一化。

根据加权值的高低对位置排序，选取前k个位置，得到推荐结果Result，其中，k的数值与具体的推荐场景相关，如果待推荐城市中的位置多于100，则k取20是一个合理的选择。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 与地理特征相关的个性化位置推荐系统 [P] . 中国专利： CN105718576B . 2019.07.16
2. 与地理特征相关的个性化位置推荐系统 [P] . 中国专利： CN105718576A . 2016-06-29
3. - Personalized Venue Recommendation System Using Inferred User-Place Relevance From a User-Place Multidimensional Network [P] . 韩国专利： KR20180012934A . 2018-02-07

机译： -使用从用户位置多维网络推断出的用户位置相关性的个性化场地推荐系统
4. Geolocation data adding method for radio communication network, involves associating cell identifier having image input geographic reference with characterization identifier to form set of identifiers, and storing identifiers in terminal [P] . 法国专利： FR2864279A1 . 2005-06-24

机译：用于无线电通信网络的地理位置数据添加方法，包括将具有图像输入地理参考的小区标识符与特征标识符相关联以形成标识符集合，并将标识符存储在终端中
5. System configured to sample at least a feature associated with a geographical area at multiple locations within that Geographic area and Method for using Said SystemEMA [P] . AR011016A1 . 2000-08-02

机译：被配置为在与该地理区域内的多个位置处的地理区域相关联的至少一个特征上采样的系统以及使用所述SystemEMA的方法