法律状态公告日
法律状态信息
法律状态
2020-07-28
授权
授权
2017-10-10
实质审查的生效 IPC(主分类):G06F17/30 申请日:20170424
实质审查的生效
2017-09-08
公开
公开
技术领域
本发明属于个性化推荐技术领域,尤其涉及一种基于超图结构的社交网络推荐模型构建方法。
背景技术
随着网络信息以指数级增长,如何提高信息利用效率,缓解信息过载问题一直是一个重要的研究领域。其中推荐系统是解决上述问题的重要途径,目前推荐系统在电子商务、信息检索、智慧旅游、网络广告、移动应用、舆情预测等领域有着重要作用,自2006年Netflix宣布推荐系统竞赛以来,激起了很多科研工作者的兴趣,其中推荐准确性成了各个推荐系统最重要的衡量指标。
传统的KNN协同过滤推荐,由于只利用邻居用户评分信息对推荐项目进行预测,因而造成推荐准确度较低的问题。
发明内容
本发明实施例提供一种基于超图结构的社交网络推荐模型构建方法,旨在解决传统的KNN协同过滤推荐,由于只利用邻居用户评分信息对推荐项目进行预测,因而造成推荐准确度较低的问题。
本发明实施例提供了一种基于超图结构的社交网络推荐模型构建方法,该方法包括如下步骤:
S1、基于社交网络中的用户-项目评分矩阵构建以项目为中心的超图及以用户为中心的超图;
S2、基于所述项目为中心的超图及所述以用户为中心的超图确定用户的邻居用户和项目的邻接项目,计算用户评价相似度,项目特征相似度及用户特征相似度;
S3、在矩阵因子分解模型的基础上,融入用户评价相似度、用户特征相似度和项目特征相似度,获取目标函数;
S4、对目标函数采用随机梯度下降算法,可迭代求出用户潜在因子矩阵Pi及项目潜在因子矩阵Qj;
S5、基于用户潜在因子矩阵Pi及项目潜在因子矩阵Qj预测用户对项目的评分,向用户推荐预测评分最高的项目。
本发明实施例在矩阵因子分解模型的基础上,融入社交网络中存在多种社交信息,包括用户特征、项目特征、用户评分,因而使得推荐模型描述得更为全面,从而提高推荐系统的准确率。
附图说明
图1为本发明实施例提供的基于超图结构的社交网络推荐模型构建方法的流程图;
图2为本发明实施例提供的用户对电影的评价表;
图3为本发明实施例提供的基于用户对电影的评价表构建的以用户为中心的超图;
图4为本发明实施例提供的基于用户对电影的评价表构建的以项目为中心的超图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为本发明实施例提供的基于超图结构的社交网络推荐模型构建方法的流程图,该方法包括如下步骤:
S1、基于社交网络中的用户-项目评分矩阵构建以项目为中心的超图及以用户为中心的超图;
在本发明实施例中,假设某社交网络有m个项目,有n个用户,基于该社交网络构建m×n的评分矩阵,例如,社交网络有四个电影资源,分别是S={s1,s2,s3,s4},有8个用户分别是U={u1,u2,u3,u4,u5,u6,u7,u8},假设用户对电影的评价表如图2所示,构建以用户为中心的超图如图3所示,构建的以项目为中心的超图如图4所示,若该网络是一个以项目为中心的超图,其中该网络表示为H=(S,ES),其中S={s1,s2,…,sm}代表项目节点集合,ES={es1,es2,…,esm}表示超边结合,其满足条件
S2、基于项目为中心的超图及以用户为中心的超图确定用户的邻居用户和项目的邻接项目,计算用户评价相似度,项目特征相似度及用户特征相似度;
在本发明实施例中,用户ui和用户uj共同评价过的项目集合为Is={s1,s2,…,sn},即
用户ui和用户uj共同评价过的项目集合为Is={s1,s2,…,sn},则用户ui和用户uj的评价相似度定义为:
其中,Sim_C(ui,uj)简记为SCij,即为用户评价相似度,
其中,Rik=Rank(ui,sk)为用户ui对项目sk的评价,即为用户对项目提供的服务进行等级评定。
在本发明实施例中,项目si和项目sj的特征相似度,用特征向量的余弦相似度表示,即:
将Sim_S(si,sj)简记为SSij,即为项目特征相似度,
在本发明实施例中,用户ui和用户uj的特征相似度,用特征向量的余弦相似度表示,即:
将Sim_U(ui,uj)简记为SUij,即为用户特征相似度,其中,
S3、在矩阵因子分解模型的基础上,融入用户评价相似度、用户特征相似度和项目特征相似度,获取目标函数;
在本发明实施例中,矩阵因子分解模型是在户潜在因子的概率分布及项目潜在因子的概率分布满足零均值高斯先验基础之上建立的模型。
步骤S3具体包括如下步骤:
S31、设定用户潜在因子的概率分布及项目潜在因子的概率分布满足零均值高斯先验,构建矩阵因子分解模型;
在本发明实施例中,用户潜在因子的概率分布及项目潜在因子的概率分布满足零均值高斯先验,所以用户潜在因子的概率分布及项目潜在因子的概率分布表达式如下:
其中,
S32、在用户潜在因子的概率分布基础上融入用户评价相似度,基于给定的定邻居用户潜在因子得到第一目标用户潜在因子条件概率分布;
在本发明实施例中,用户倾向于购买朋友推荐的商品,因此使用朋友圈或邻居用户的信息可以提高推荐准确度,即用户的兴趣受邻居用户的潜在因子影响,即在公式(5)的基础上融入用户评价相似度,在给定邻居用户潜在因子条件下可以得到第一目标用户潜在因子条件概率分布,具体如下:
其中,p(P|SC,Ω)表示第一目标用户潜在因子条件概率分布,Ω表示零均值球面高斯先验,Nui表示用户ui的邻居用户,SCiv表示用户ui和其邻居用户uv之间的评价相似度,Pv表示邻居用户uv的潜在因子特征矩阵,在本发明实施例中,邻居用户是指用户ui和用户uv对共同评价过项目sj,即
S33、在用户潜在因子的概率分布基础上融入用户特征相似度,基于给定的邻居用户特征得到第二目标用户潜在因子条件概率分布;
在本发明实施例中,具有相同特征的用户往往具有较类似的用户兴趣,因此邻居用户特征对目标用户潜在因子产生影响,即可在公式(5)的基础上融入用户特征相似度,基于给定的邻居用户特征得到第二目标用户潜在因子条件概率分布,具体如下:
其中,p(P|SU,Ω)为第二目标用户潜在因子条件概率分布,Ω表示零均值球面高斯先验,Nui表示用户ui的邻居用户,SUiv表示用户ui和其邻居用户uv的特征相似度,Pv表示邻居用户uv的潜在因子特征矩阵。
S34、在项目潜在因子的概率分布基础上融入项目特征相似度,基于给定的邻接项目特征得到目标项目潜在因子条件概率分布;
在本发明实施例中,具有相同特征的项目在某个时间段类会比较流行,因此邻接项目特征对目标项目潜在因子产生影响,即可在公式(6)的基础上融入项目特征相似度,基于给定的邻接项目特征得到目标项目潜在因子条件概率分布,具体如下:
其中,p(Q|SS,Ω)为目标项目潜在因子条件概率分布,Ω表示零均值球面高斯先验,
在本发明实施例中,上述步骤S32、步骤S33及步骤S34在顺序上并无先后之分。
S35、在以矩阵因子分解模型的基础上,结合第一目标用户潜在因子条件概率分布、第二目标用户潜在因子条件概率分布及目标项目潜在因子条件概率分布,通过贝叶斯定理推理获取推导公式;
通过贝叶斯定理推理,结合公式(7)、(8)和(9),得到下列推导公式:
其中,Iij为指示变量,若用户ui对项目sj存在评分,则取值1,否则取值0。
S36、利用凸优化理论对推导进行求对数,即可以得到目标函数。
在本发明实施例中,目标函数的表达式如下:
其中,Rij为用户ui对项目sj的评分,
S4、对目标函数采用随机梯度下降算法,可迭代求出用户潜在因子矩阵Pi及项目潜在因子矩阵Qj;
在本发明实施例中,按照式迭代公式(12)和(13)进行迭代,即可求出用户潜在因子矩阵Pi及项目潜在因子Qj,其中迭代公式(12)、(13)表示如下:
其中t是迭代次数,l是步长,本发明是实施例中默认值取为0.0005,可以根据精度需要自行设置,其一般取值范围是[0.0001,0.1],
S5、基于用户潜在因子矩阵Pi及项目潜在因子矩阵Qj测用户对项目的评分,向用户推荐预测评分最高的项目。
在本发明实施例中,用户对项目评分的预测可以采取公式如下:
其中,
本发明实施例在矩阵因子分解模型的基础上,融入社交网络中存在多种社交信息,包括用户特征、项目特征、用户评分,因而使得推荐模型描述得更为全面,从而提高推荐系统的准确率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
机译: 基于图形的超图实体关系信息结构数据检索方法和结构
机译: 在社交网络中建立和使用用户推荐模型的方法和装置
机译: 在社交网络中建立和使用用户推荐模型的方法和装置