法律状态公告日
法律状态信息
法律状态
2020-07-28
授权
授权
2018-11-02
实质审查的生效 IPC(主分类):G06F17/30 申请日:20180423
实质审查的生效
2018-10-09
公开
公开
技术领域
本发明涉及一种网络学习用户的群组划分方法,具体涉及一种基于学习生成网络相似度的网络学习群组划分方法。
背景技术
大部分推荐系统主要关注单个用户的推荐,然而在许多日常活动中需要为多个用户形成的群组进行推荐。近年来,组推荐系统(Group recommendation system)逐渐成为推荐系统领域的研究热点之一,如何融合群组成员偏好以满足成员的偏好需求进行群组划分是组推荐的主要任务。
具体而言,群组划分是指将用户分配至不同的组合,使得每个组合内的用户在某些方面有着相同的特征。王中卿提出一种隐含因子图模型,利用各种隐含与显式的社交与文本信息对用户的群组进行识别,并对用户群组识别模型进行学习与预测;Chen L采用学习者的选课信息、学习兴趣、知识水平,量化用户特征,使用遗传算法划分群组;张晖基于用户基本信息、业务兴趣相似度、业务顺序相似度,构建基于用户综合相似度的模糊聚类模型,从而进行用户分群;Boratto L浏尝试多种特征,构建多种群组模型,进而找出最佳建模策略;金涛提出使用局部敏感哈希技术(Locality Sensitive Hash,即LSH)以达到群组快速生成的目的;谭昶提出典型用户群组(Typical User Group,TUG)的概念,通过比较候选新增典型用户对典型用户群组的贡献度,逐一扩大典型用户群组规模,最终达到较高的推荐项目覆盖率和评分准确度;Zhang C提出了一种群体推荐的用户聚类算法,采用奇异值分解算法提取了主要用户特征,通过减少用户特征向量的维数简化了计算;Young-Duk Seo提出了一种向上均衡聚合方法(upward leveling aggregation method)用于解决群组推荐中的成员偏好差异。
由上述文献可看出,在群组划分时用户特征选择是一个重要的方面,往往需要结合用户的静态和动态特征以建立最佳的群组模型。尤其随着时间的推移,用户的兴趣偏好会发生变化,群组也随之动态变化。在学习领域,学习群组通常是指具有相类似学习兴趣的用户,比如,访问了相同学习资源的用户,因此用户对学习资源的显示评分及对资源访问的隐式属性(学习时长、学习频次)等特征常被用于计算用户的相似度。然后,已有特征往往缺乏用户认知的考虑,无法完整刻画用户整个学习过程,这从一定程度上影响了群组划分的准确性。比如,学习了两个相同知识点或者访问了相同学习资源的用户,如果各自学习时间间隔相差非常远,根据艾宾浩斯提出的遗忘曲线,则基本上可以忽略其相似性。因此,如何体现用户的学习过程及认知特征是群组划分时应该解决的一个重要问题。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于学习生成网络相似度的网络学习群组划分方法,该划分方法考虑用户学习过程及认知特征实现网络学习群组划分。
为达到上述目的,本发明所述的基于学习生成网络相似度的网络学习群组划分方法包括以下步骤:
1)根据用户信息、知识点信息及用户的网络学习日志构建用户知识点关联网络,再利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度;同时,获取用户学习知识点之间的学习顺序相关性及学习时间相关性,再根据用户学习知识点之间的学习顺序相关性及学习时间相关性依次计算用户学习序列中第i+1个知识点与前i个知识点的时序相关度,其中,1≤i≤n,n为用户学习知识点的序列长度;
2)根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络;
3)获取用户学习生成网络中任一两节点之间的路径,将两个用户ux、uy学习生成网络
4)计算各用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环的平均大小,并从节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环平均大小的角度出发计算用户学习生成网络
5)使用内容相似度
步骤1)中构建用户知识点关联网络的具体操作为:利用用户信息、知识点信息以及用户的网络学习日志获取用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系,再根据用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系计算用户-用户、知识点-知识点及用户-知识点之间的边权重,然后根据用户-用户、知识点-知识点及用户-知识点之间的边权重构建用户知识点关联网络。
步骤2)的具体操作为:根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度依次计算用户学习序列中第i+1个知识点和前i个知识点的匹配度,根据计算得到的匹配度构建用户学习生成网络。
构建用户-用户之间的关系,计算用户-用户之间的边权重的具体操作为:用户-用户之间的关系Eu由两个用户ux、uy之间属性的相似性来度量,其中,两个用户ux、uy之间属性包括入学时间、学历级用户专业,设用户-用户之间的边权重为
其中,
构建知识点-知识点之间的关系,计算知识点-知识点之间的边权重的具体过程为:
知识点-知识点之间的关系Es为知识点si与sj之间属性的关系,其中,知识点si与sj之间的属性包括知识点si与sj之间的章节关系、知识点si与sj之间学习的先后序关系,设知识点si与sj之间的边权重为
其中,
构建用户-知识点之间的关系,计算用户-知识点之间的边权重的具体操作为:
用户学习-知识点之间关系从用户的网络学习日志中获取,当用户学习过该知识点,则生成一条连接用户与该知识点的边,则用户-知识点之间的边权重
其中,
步骤1)中利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度的具体操作为:
设权重矩阵A:
其中,wij表示节点与节点之间的权重边,cij表示节点i与节点j之间是否连接,其中,1表示连接,0表示不连接;
设用户知识点关联网络的对角矩阵D:
设用户知识点关联网络对称拉普拉斯矩阵L=D-A及广义逆矩阵L+,其中,
L+=(L-eeT/n)-1+eeT/n(6)
其中,e为单位矩阵,e=[1]n×1;
则节点i与节点j之间的相似距离disij为:
其中,
当disij值越大,则表示节点i与节点j之间的相似性越小,将disij作为节点i与节点j之间的相似度。
步骤1)中,知识点之间的时序相关性表示知识点之间的学习顺序相关性及学习时间相关性,当用户学习生成网络中已有i个节点,当新增第i+1个节点时,则有
其中,γ和δ为归一化系数,第i+1个节点与第k个节点的时序相关性seci+1,k由学习顺序相关性
第i+1个知识点与第k个知识点的匹配度
其中,a及β为权重系数。
步骤3)中学习生成网络
其中,N为PLGN所属课程的总知识点数,
本发明具有以下有益效果:
本发明所述的基于学习生成网络相似度的网络学习群组划分方法在具体操作时,通过用户信息、知识点信息及用户的网络学习日志构建用户的知识点关联网络,以考虑用户学习过程及认知特征,再利用用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络,进而从内容相似度及结构相似度两个方面进行学习生成网络的相似度度量,并以此实现网络学习群组划分,为进行更加符合组用户偏好的学习资源推荐提供基础。
附图说明
图1为本发明的流程图;
图2a为学习知识点较多、发散地、跳跃地学习知识点的学习群组示意图;
图2b为学习知识点较少、按顺序学习知识点的学习群组示意图。
具体实施方式
下面结合附图对本发明做进一步详细描述:
参考图1,本发明所述的基于学习生成网络相似度的网络学习群组划分方法包括以下步骤:
1)根据用户信息、知识点信息及用户的网络学习日志构建用户知识点关联网络,再利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度;同时,获取用户学习知识点之间的学习顺序相关性及学习时间相关性,再根据用户学习知识点之间的学习顺序相关性及学习时间相关性依次计算用户学习序列中第i+1个知识点与前i个知识点的时序相关度,其中,1≤i≤n,n为用户学习知识点的序列长度;
2)根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络;
3)获取用户学习生成网络中任一两节点之间的路径,将两个用户ux、uy学习生成网络
4)计算各用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环的平均大小,并从节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环平均大小的角度出发计算用户学习生成网络
5)使用内容相似度
步骤1)中构建用户知识点关联网络的具体操作为:利用用户信息、知识点信息以及用户的网络学习日志获取用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系,再根据用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系计算用户-用户、知识点-知识点及用户-知识点之间的边权重,然后根据用户-用户、知识点-知识点及用户-知识点之间的边权重构建用户知识点关联网络。
步骤1)中构建用户-用户之间的关系,计算用户-用户之间的边权重的具体操作为:用户-用户之间的关系Eu由两个用户ux、uy之间属性的相似性来度量,其中,两个用户ux、uy之间属性包括入学时间、学历级用户专业,设用户-用户之间的边权重为
其中,
步骤1)中构建知识点-知识点之间的关系,计算知识点-知识点之间的边权重的具体过程为:
知识点-知识点之间的关系Es为知识点si与sj之间属性的关系,其中,知识点si与sj之间的属性包括知识点si与sj之间的章节关系、知识点si与sj之间学习的先后序关系,设知识点si与sj之间的边权重为
其中,
步骤1)中构建用户-知识点之间的关系,计算用户-知识点之间的边权重的具体操作为:
用户学习-知识点之间关系从用户的网络学习日志中获取,当用户学习过该知识点,则生成一条连接用户与该知识点的边,则用户-知识点之间的边权重
其中,
步骤1)中利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度的具体操作为:
设权重矩阵A:
其中,wij表示节点与节点之间的权重边,cij表示节点i与节点j之间是否连接,其中,1表示连接,0表示不连接;
设用户知识点关联网络的对角矩阵D:
设用户知识点关联网络对称拉普拉斯矩阵L=D-A及广义逆矩阵L+,其中,
L+=(L-eeT/n)-1+eeT/n(6)
其中,e为单位矩阵,e=[1]n×1;
则节点i与节点j之间的相似距离disij为:
其中,
当disij值越大,则表示节点i与节点j之间的相似性越小,将disij作为节点i与节点j之间的相似度。
步骤1)中,知识点学习顺序相关性取决于用户学习知识点的先后序差异。例如,用户的学习序列为“s3-s2-s4-s1-s5”,那么用户学习知识点s1、s3的顺序差为3,学习s1、s5的顺序差为1。从用户学习顺序的角度考虑,知识点s1与知识点s3的相关性较小,而与知识点s5的相关性较大。
知识点学习时间相关性取决于指用户学习知识点的时间上差异。例如,用户在10h前学了知识点s3,在8h前学了知识点s2,在2h前学了知识点s4,那么知识点s3、s2之间的学习时间差为2h,知识点s2、s4之间的学习时间差为6h。从用户学习时间的角度考虑,知识点s2与知识点s3的相关性较大,而与知识点s4的相关性较小。
当用户学习生成网络中已有i个节点,当新增第i+1个节点时,则有
其中,γ和δ为归一化系数,第i+1个节点与第k个节点的时序相关性seci+1,k由学习顺序相关性
步骤2)的具体操作为:根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度依次计算用户学习序列中第i+1个知识点和前i个知识点的匹配度,根据计算得到的匹配度构建用户学习生成网络。
其中,第i+1个知识点与第k个知识点的匹配度
其中,α及β为权重系数,本发明中α及β均为0.5。
使用匹配度
k的选取需要考虑到知识点学习的依赖关系的时效性,当用户学习两个知识点的时间距离大于一定的阈值后,则可以认为用户学习后一个知识点不存在对前一个知识点的学习依赖,表1为用户学习生成网络的构建算法。
表1
步骤3)中,图2a和图2b表示两类不同的群组,图2a代表学习知识点较多、发散地、跳跃地学习知识点,图2b表示学习知识点较少、按顺序学习知识点。可以看出,从图的结构和学习的内容上都有所差异,因此本发明提出同时考虑PLGN结构的相似度和内容的相似度来进行学习群组的划分。
本发明采用的相似性指标的具体组成为:
本发明统计用户学习生成网络图中任何两点之间的路径,将两张用户学习生成网络
a)若
b)若
c)若
则学习生成网络
其中,N为PLGN所属课程的总知识点数,
用户学习生成网络的结构相似性体现在节点数、边数、平均出入度、最大出度、最大入度、平均节点强度-权重和、最大节点强度及子图数目等方面,对于按顺序学习知识点的用户来说,其学习网络往往呈现为平稳的链式结构;对于学习无规律、跳跃性较大的用户来说,其学习网络中会出现较多的树状和网状结构。
本发明计算用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量和网络中环的平均大小,并从这6个角度出发计算用户学习生成网络之间的结构相似度。
用户学习生成网络
其中,
另外,用户学习生成网络的总体相似性可以从用户学习生成网络的内容相似性和结构相似性的角度来衡量,用户学习生成网络
其中,α和β为权值,本发明中a=0.7,β=0.3。
步骤5)中,采用基于相似度的CURE层次聚类算法对用户学习生成网络进行聚类,根据聚类结果得到网络学习用户的群组划分,其中,聚类原理为:将每个用户学习生成网络各作为一簇,每次合并距离最近的两簇,直至剩余簇的数量满足聚类目标,最终得到的簇集合{Clusteri}即为聚类结果,其中,表2为用户学习生成网络的聚类算法。
表2
机译: 光学神经网络的学习信号生成方法,学习信号生成设备和光学神经网络学习操作设备
机译: 神经网络学习方法,神经网络生成方法,学习设备,便携式终端设备,学习处理设备和计算机程序
机译: 基于体系结构变异的无监督学习和基于选择性误差传播的监督学习的神经网络学习方法及装置