法律状态公告日
法律状态信息
法律状态
2019-07-16
授权
授权
2016-07-27
实质审查的生效 IPC(主分类):G06F17/30 申请日:20160122
实质审查的生效
2016-06-29
公开
公开
技术领域
本发明属于数据处理技术领域,特别涉及一种与地理特征相关的个性化推荐技术,可用于基于位置社交网络中的地点推送服务。
背景技术
伴随着数据库技术的迅速发展和数据库管理系统的广泛应用,数据积累的越来越多。面对激增的数据,人们希望能够挖掘出隐藏在背后的许多重要的信息,从而可以更好地利用这些数据为人们服务。服务提供商拥有海量的与用户有关的个人信息和历史记录,利用这些数据向用户主动推荐相关服务既可以方便用户,又有益于服务提供商。
传统的推荐系统算法主要使用的是基于协同过滤的推荐算法,基于内容的推荐算法。无线网络和位置感知技术的出现和进步,推动着移动互联网,尤其是基于位置的社交网络的蓬勃发展,用户的地理位置数据通过客户端GPS开始被大量获取。地理上下文开始成为位置推荐的重要特征属性,使得一些基于用户地理位置的商品推荐任务成为可能。
在收集到用户的地理位置数据后,需要先对用户在地理位置上进行划分,划分方法是基于用户签到位置所在地的经度和纬度为基础的划分方法。然后,通过扫描该地区所有用户的位置历史记录以及待推荐用户的所有历史记录,通过预设模型计算用户和地区对位置的预测分数,进而获得候选位置,进行基于模型的协同过滤的推荐计算。
当前已有的基于协同过滤的推荐计算方案中,一种是基于用户本身之间的相似程度,一种是基于物品本身之间的相似程度。
上述方法中,由于均没有考虑地理特征在为用户进行地点推荐的影响,因而在数据稀疏场景中,如异地位置推荐,性能表现很差,而且对于新用户和新物品的冷启动问题,也无法有效解决。
发明内容
本发明的目的在于针对以上方法的不足,提出了一种与地理特征相关的个性化位置推荐系统,结合位置类别以及地理特征,使用潜在狄利克雷分配主题模型,为用户提供有感兴趣的位置。
为实现上述目的,本发明的推荐系统包括:
数据获取模块DC,用于抓取目标网站用户的签到记录,为用户数据库模块UD和地理数据库模块DD提供数据;
用户数据库模块UD,用于将数据抓取模块DC抓取的全部信息以用户ID作为索引存储在用户数据库中,为用户偏好挖掘模块UM提供用户信息;
地理数据库模块DD,用于将数据抓取模块DC抓取的全部信息以地理城市作为索引存储在地理数据库中,为地理特征挖掘模块DM提供地理信息;
用户偏好挖掘模块UM,用于使用用户数据库模块UD中的数据去挖掘用户的偏好,得到按照用户偏好排序的候选位置推荐列表List1;
地理特征挖掘模块DM,用于使用地理数据库模块DD中的数据挖掘地理特征,得到按照地理特征影响排序的候选位置推荐列表List2;
推荐模块RD,用于根据按照用户偏好排序的候选位置推荐列表List1和按照地理特征影响排序的候选位置推荐列表List2,产生最终的推荐结果Result。
本发明的优点是:
本发明通过用户偏好挖掘模块学习用户的个人兴趣,从而实现了个性化的位置推荐;
本发明通过地理特征挖掘模块综合地理特征影响,从而缓解了数据的稀疏性问题,尤其是异地位置推荐问题。
附图说明
图1是本发明的推荐系统整体框架图;
图2是本发明中用户偏好挖掘模块框架图;
图3是本发明中地理特征挖掘模块框架图;
图4是本发明中推荐模块框架图。
以下结合附图对本发明的实施例和效果进行详细描述。
具体实施方案
本发明的核心思想是考虑地理特征的影响,结合位置类别,使用潜在狄利克雷分配主题模型,提出了一种与地理特征相关的个性化位置推荐系统,为用户提供感兴趣的位置。
参照图1,本发明包括:数据获取模块DC,用户数据库模块UD,地理数据库模块DD,用户偏好挖掘模块UM,地理特征挖掘模块DM和推荐模块RD。其中,数据获取模块DC,用于抓取目标网站用户的签到记录,为用户数据库模块UD和地理数据库模块DD提供数据;用户数据库模块UD,用于将数据获取模块DC获取的全部信息以用户ID作为索引存储在用户数据库中,为用户偏好挖掘模块UM提供用户信息;用户偏好挖掘模块UM,使用用户数据库模块DC中的用户签到记录,挖掘待推荐用户的偏好,得到按照用户偏好排序的候选位置推荐列表List1;地理数据库模块DD,用于将数据获取模块DC获取的全部信息以地理城市作为索引存储在地理数据库中,为地理特征挖掘模块DM提供地理信息;地理特征挖掘模块DM使用地理数据库模块DD中不同地理城市包括的用户签到记录,挖掘待推荐城市的地理特征,得到按照地理特征影响排序的候选位置推荐列表List2;推荐模块RD使用用户偏好挖掘模块UM得到的推荐列表List1和地理特征挖掘模块DM得到的推荐列表List2,获得最终的推荐结果。
所述的数据获取模块DC,获取目标网站用户的签到记录,其中,签到记录包括:用户ID,语义位置,如大唐芙蓉园,语义位置的类别,如旅游&交通和语义位置所在地理城市,如西安。其中,语义位置的类别包括:艺术&娱乐,学院&大学,活动,食品店,夜市,户外&休闲,居民区,商店&服务和旅游&交通。
参照图2,所述的用户偏好挖掘模块UM,包括:主题模型训练单元UM1,三层图模型构建单元UM2和位置偏好值计算单元UM3。
该主题模型训练单元UM1,用于根据用户数据库模块UD得到的用户签到记录与主题,生成每个用户对应于每个主题的主题特征向量UV;
该三层图模型构建单元UM2,用于根据用户数据库模块UD得到的用户签到记录与主题模型训练单元UM1得到的主题特征向量UV,构建由所有用户、所有位置和所有主题组成的用户层、位置层和主题层的三层图结构;
该位置偏好值计算单元UM3,用于根据用户层、位置层和主题层这三层图结构,得到用户数据库中用户‐主题概率分布的先验知识
其中,
使用用户对位置的偏好值fuv,对未访问位置进行递减排序,选取前k个位置生成按照用户偏好排序的候选位置推荐列表List1。
参照图3,所述的地理特征挖掘模块DM,包括:主题模型训练单元DM1,三层图模型构建单元DM2和位置偏好值计算单元DM3。
该主题模型训练单元DM1,用于读取地理数据库模块DD包含的地理城市中所有用户的签到记录,根据记录中的主题,生成每个位置对应于每个主题的主题特征向量DV;
该三层图模型构建单元DM2,用于根据地理数据库模块DD包含的地理城市中所有用户的签到记录以及主题模型训练模块DM1得到的主题特征向量DV,构建由所有城市,所有位置和所有主题组成的地理层,位置层和主题层的三层图结构;
该位置偏好值计算单元DM3,用于根据地理层,位置层和主题层这三层图结构,得到地理数据库中地理城市‐主题概率分布的先验知识
其中,
使用地理城市对位置的偏好值flv′,对位置进行递减排序,选取前k个位置,形成按照地理特征影响排序的候选位置推荐列表List2。
参照图4,所述的推荐模块RD,包括:加权系数计算子模块RD1和位置推荐子模块RD2。
该加权系数计算子模块RD1,用于计算相对标准方差公式计算用户的个人偏好在用户做决定时所占的加权值ωu,以及地理影响在用户做决定时所占的加权值ωl,其计算公式如下:
其中,
该位置推荐子模块RD2,用于计算所述两个推荐列表List1和List2中位置的加权值R:
R=λufuv+λlf′lv,
其中,
根据加权值的高低对位置排序,选取前k个位置,得到推荐结果Result,其中,k的数值与具体的推荐场景相关,如果待推荐城市中的位置多于100,则k取20是一个合理的选择。
机译: -使用从用户位置多维网络推断出的用户位置相关性的个性化场地推荐系统
机译: 用于无线电通信网络的地理位置数据添加方法,包括将具有图像输入地理参考的小区标识符与特征标识符相关联以形成标识符集合,并将标识符存储在终端中
机译: 被配置为在与该地理区域内的多个位置处的地理区域相关联的至少一个特征上采样的系统以及使用所述SystemEMA的方法