首页> 中国专利> 推荐学习资源的确定方法和装置

推荐学习资源的确定方法和装置

摘要

本发明公开了一种推荐学习资源的确定方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:确定目标用户的特征数据;判断所述特征数据是否符合第一预设条件;根据所述第一预设条件对应的第一判断结果,确定目标推荐算法;利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。该实施方式能够较精准地向用户推荐相关的学习资源。

著录项

说明书

技术领域

本发明涉及人工智能技术领域,尤其涉及一种推荐学习资源的确定方法和装置。

背景技术

互联网教育是互联网科技与教育领域相结合的一种新的教育形式。用户面对海量的学习资源信息,往往无法准确定位到自己需要的资源。推荐系统为根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。但现有的推荐系统中的学习资源推荐方法往往不够准确,无法满足用户的需要。

发明内容

有鉴于此,本发明实施例提供一种推荐学习资源的确定方法和装置,能够较精准地向用户推荐相关的学习资源。

第一方面,本发明实施例提供了一种推荐学习资源的确定方法,包括:

确定目标用户的特征数据;

判断所述特征数据是否符合第一预设条件;

根据所述第一预设条件对应的第一判断结果,确定目标推荐算法;

利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。

可选地,所述特征数据包括:用户兴趣标签;

所述判断所述特征数据是否符合第一预设条件,包括:

判断所述用户兴趣标签的个数是否小于第一数目阈值。

可选地,所述根据所述第一预设条件对应的第一判断结果,确定目标推荐算法,包括:

若所述第一判断结果表征所述用户兴趣标签的个数小于第一数目阈值,则将聚类算法确定为目标推荐算法;

所述利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源,包括:

利用聚类算法及所述目标用户的特征数据,确定所述目标用户的用户群;

根据所述用户群,确定所述目标用户的推荐学习资源。

可选地,所述根据所述第一预设条件对应的第一判断结果,确定目标推荐算法,包括:

若所述第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则将关联规则算法确定为目标推荐算法;

所述利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源,包括:

利用关联规则算法及所述目标用户的特征数据,确定所述目标用户的相似用户;

根据所述相似用户,确定所述目标用户的推荐学习资源。

可选地,所述根据所述第一预设条件对应的第一判断结果,确定目标推荐算法,包括:

若所述第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则将协同过滤算法确定为目标推荐算法;

所述利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源,包括:

利用协同过滤算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。

可选地,所述根据所述第一预设条件对应的第一判断结果,确定目标推荐算法,包括:

若所述第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则判断系统中的用户数目是否符合第二预设条件,所述第二预设条件包括:系统中的用户数目小于第二数目阈值;

根据所述第二预设条件对应的第二判断结果,确定目标推荐算法。

可选地,所述根据所述第二预设条件对应的第二判断结果,确定目标推荐算法,包括:

若所述第二判断结果表征所述系统中的用户数目大于或等于所述第二数目阈值,则将关联规则算法确定为目标推荐算法;

所述利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源,包括:

利用关联规则算法及所述目标用户的特征数据,确定所述目标用户的相似用户;

根据所述相似用户,确定所述目标用户的推荐学习资源。

可选地,所述根据所述第二预设条件对应的第二判断结果,确定目标推荐算法,包括:

若所述第二判断结果表征所述系统中的用户数目小于所述第二数目阈值,则将协同过滤算法确定为目标推荐算法;

所述利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源,包括:

利用协同过滤算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。

可选地,还包括:

获取第一训练集,所述第一训练集中包括多个学习资源;

获取测试用户在所述训练集上的第一行为数据;

根据所述第一行为数据,确定所述测试用户的第一推荐列表;

利用所述目标推荐算法、所述测试用户的特征数据及所述第一训练集,确定所述测试用户的第一行为列表;

根据所述第一推荐列表及所述第一行为列表,确定所述推荐学习资源的确定方法的准确率。

可选地,还包括:

获取第二训练集,所述第二训练集中包括多个学习资源;

获取测试用户在所述训练集上的第二行为数据;

根据所述第二行为数据,确定所述测试用户的第二推荐列表;

利用所述目标推荐算法、所述测试用户的特征数据及所述第二训练集,确定所述测试用户的第二行为列表;

根据所述第二推荐列表及所述第二行为列表,确定所述推荐学习资源的确定方法的召回率。

可选地,所述确定目标用户的特征数据,包括:

获取所述目标用户的日志文件;

对所述日志文件进行预处理,所述预处理包括以下之一:分词处理、特征词识别、无效字符过滤;

对处理后的日志文件进行统计分析,以确定所述目标用户的特征数据。

可选地,所述特征数据包括:显性数据及隐形数据;

所述显性数据包括以下至少之一:资源评论、资源点赞、资源转发、资源下载、用户评分反馈、下载资源、做题记录、搜索课程资源、与课程互动次数、每次互动时间、系统在线时长;

所述隐形数据包括以下至少之一:浏览历史、阅读时长、观看记录、搜索日志。

第二方面,本发明实施例提供了一种推荐学习资源的确定装置,包括:

数据确定模块,用于确定目标用户的特征数据;

条件判断模块,用于判断所述特征数据是否符合第一预设条件;

算法确定模块,用于根据所述第一预设条件对应的第一判断结果,确定目标推荐算法;

资源确定模块,用于利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。

第三方面,本发明实施例提供了一种电子设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。

第四方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。

上述发明中的一个实施例具有如下优点或有益效果:根据目标用户的特征数据是否符合第一预设条件,来确定目标推荐算法,再利用目标推荐算法及目标用户的特征数据,确定目标用户的推荐学习资源。本发明实施例没有采用固定的推荐算法,而是根据用户的特征数据决定目标推荐算法,得到的推荐学习资源更加精准,可更好地满足用户的需要。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是本发明实施例可以应用于其中的示例性系统架构图;

图2是本发明的一个实施例提供的一种推荐学习资源的确定方法的流程的示意图;

图3是本发明的一个实施例提供的另一种推荐学习资源的确定方法的流程的示意图;

图4是本发明的一个实施例提供的又一种推荐学习资源的确定方法的流程的示意图;

图5是本发明的一个实施例提供的一种推荐学习资源的确定装置的结构示意图;

图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1示出了可以应用本发明实施例的推荐学习资源的确定方法或推荐学习资源的确定装置的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件、办公应用等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的在线教育类网站提供支持的后台管理服务器(仅为示例)。服务器105可以根据目标用户的特征数据是否符合第一预设条件,确定目标推荐算法;再利用目标推荐算法,确定目标用户的推荐学习资源。

需要说明的是,本发明实施例所提供的推荐学习资源的确定方法方法一般由服务器105执行,相应地,推荐学习资源的确定方法装置一般设置于服务器105中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2是本发明的一个实施例提供的一种推荐学习资源的确定方法的流程的示意图,如图2所示,该方法包括:

步骤201:确定目标用户的特征数据。

收集目标用户的相关特征数据,用以生成推荐任务的用户画像,这些特征数据包括用户属性、用户行为数据或用户访问的资源。通过建立用户画像,推荐系统对用户进行学习资源的推荐。

依赖于不同类型的输入,特征数据可以是显性数据,也可以是隐性数据。例如最直接的显式反馈可以为用户直接输入感兴趣的内容。隐式反馈可以为通过观察用户行为间接地推断用户偏好,还可以通过显式和隐式反馈的组合来获得混合反馈。

显性数据就是指用户主动输入的数据,例如对内容的评论、点赞、转发、下载等,隐性数据是指用户的浏览历史、阅读时长、观看记录、搜索日志等。后台会为每一个使用该产品/访问该站点的用户创建一个数据集。

具体地,显性数据可包括:资源评论、资源点赞、资源转发、资源下载、用户评分反馈、下载资源、做题记录、搜索课程资源、与课程互动次数、每次互动时间、系统在线时长等。隐形数据可包括:浏览历史、阅读时长、观看记录、搜索日志等。

以网络学习平台为例,用户画像是与特定用户相关联的个人信息的集合。这些信息包括该用户的认知技能、智力水平、学习方式、兴趣爱好以及交互行为等。用户画像通常用于用户模型构建时信息检索所需。换句话说,用户画像粗略地反映了用户模型。要想做成功一个推荐系统,很大程度上取决于其对用户兴趣的表征能力。要想获得准确的推荐结果,准确的用户模型必不可少。

由于每个用户对产品的喜好不一,因此收集到的每位用户的特征数据集也截然不同。随着时间的推移,收集到的用户特征数据也越来越多,通过一系列数据分析,推荐的结果也会越来越精准。

用户特征数据可以使用数据矩阵来表示,使用平移标准差变换和极大极小值变换对数据矩阵进行标准化处理。数据矩阵的标准化处理可以有效避免数值问题,因为数据过大可能导致数量级的不同差异对最终的数据分类结果产生较大的影响;同时,标准化处理还可以平衡用户的特征数据对K-均值聚类和关联规则分析的影响,实现更佳的分类和推荐效果。

步骤202:判断特征数据是否符合第一预设条件。

第一预设条件可根据具体需求和实际应用环境进行设定。例如,第一预设条件可以为:用户兴趣标签的个数是否小于第一数目阈值、用户数目是否小于第二数目阈值、学习资源数目是否小于第三数目阈值等。

步骤203:根据第一预设条件对应的第一判断结果,确定目标推荐算法。

目标推荐算法可根据具体需求和实际应用环境进行设定。例如,目标推荐算法可以为基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法等。

步骤204:利用目标推荐算法及目标用户的特征数据,确定目标用户的推荐学习资源。

学习资源为用于帮助用户学习的资源。学习资源可包括:视频、音频、课件、电子书、题库、模拟试卷等。

在本发明实施例中,根据目标用户的特征数据是否符合第一预设条件,来确定目标推荐算法;再利用目标推荐算法及目标用户的特征数据,确定目标用户的推荐学习资源。本发明实施例没有采用固定的推荐算法,而是根据用户的特征数据决定目标推荐算法,得到的推荐学习资源更加精准。因此,可解决无法将较精准的学习资源推荐给用户的问题。

资源推荐后,可通过准确率(Precision)和召回率(Recall)度量指标计算结果,可以实现对该推荐效果的有效评估。

在本发明的一个实施例中,该方法还包括:获取第一训练集,第一训练集中包括多个学习资源;获取测试用户在第一训练集上的第一行为数据;根据第一行为数据,确定测试用户的第一推荐列表;利用目标推荐算法、测试用户的特征数据及第一训练集,确定测试用户的第一行为列表;根据第一推荐列表及第一行为列表,确定推荐学习资源的确定方法的准确率。准确率的计算方式如下公式所示:

其中,Precision代表准确率,R(u)是测试用户在第一测试集上的第一行为列表,第一行为列表是利用本发明实施例的方法预测得到的,而T(u)是根据测试用户在第一训练集上的行为作出的第一推荐列表。

在本发明的一个实施例中,该方法还包括:获取第二训练集,第二训练集中包括多个学习资源;获取测试用户在第二训练集上的第二行为数据;根据第二行为数据,确定测试用户的第二推荐列表;利用目标推荐算法、测试用户的特征数据及第二训练集,确定测试用户的第二行为列表;根据第二推荐列表及第二行为列表,确定推荐学习资源的确定方法的召回率。召回率的计算方式如下公式所示:

其中,Recall代表召回率,R(u)是测试用户在第二测试集上的第二行为列表,第二行为列表是利用本发明实施例的方法预测得到的,而T(u)是根据测试用户在第二训练集上的行为作出的第二推荐列表。

在本发明的一个实施例中,确定目标用户的特征数据,包括:获取目标用户的日志文件;对日志文件进行预处理,预处理包括以下之一:分词处理、特征词识别、无效字符过滤;对处理后的日志文件进行统计分析,以确定目标用户的特征数据。通过上述方法,可准确完整地提取出目标用户的特征数据。

针对互联网教育在线平台中存在的信息过载问题,本发明实施例采用K-均值聚类算法,对平台用户进行聚类,解决了推荐系统中的冷启动问题;通过用户的课程资源学习记录,采用协同过滤算法,并利用关联规则挖掘技术中的Apriori算法来发现兴趣相似用户,依据其他用户感兴趣的课程资源生成目标用户的个性化资源推荐列表,避免对用户显式数据的依赖,能有效分析用户的隐式特征数据。本发明实施例的方法可为用户提供了个性化课程学习资源推荐,满足了用户的个性化需求。图3是本发明的一个实施例提供的一种推荐学习资源的确定方法的流程的示意图,如图3所示,该方法包括:

步骤301:确定目标用户的特征数据,特征数据包括:用户兴趣标签。

步骤302:判断用户兴趣标签的个数是否小于第一数目阈值。

若第一判断结果表征所述用户兴趣标签的个数小于第一数目阈值,则执行步骤303;若第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则执行步骤305或步骤307。

步骤303:将聚类算法确定为目标推荐算法,利用聚类算法及目标用户的特征数据,确定目标用户的用户群。

推荐系统存在冷启动问题,对于新用户或兴趣标签不满足个数要求的用户进行均值聚类而言,由于无法得到新用户的兴趣标签,需要对已有用户的信息进行聚类处理。采用均值聚类算法对平台的用户个人信息数据进行聚类处理,用户被划分为不同的类簇,每一个类簇表示一个具有相似兴趣的用户群体。K-means聚类(K均值聚类)算法核心思想是首先随机选取初始聚类中心,然后计算每个样本点到初始聚类中心的欧氏距离,按照距离最近的准则将它们分配给相似度最大的聚类中心所代表的的类;最后计算每个类簇所有样本点的均值,更新聚类中心,直到目标准则函数收敛为止。

步骤304:根据用户群,确定目标用户的推荐学习资源。

可通过下述方法确定用户的推荐学习资源。

方式一、提取出目标用户所在的用户群的前面若干个的兴趣标签,并将标签赋予处于类簇中的目标用户。通过提取出的兴趣标签,完成用户前期使用学习平台的课程资源推荐。

方式二、确定出目标用户所在的用户群的用户关注学习或浏览较多的学习资源,并将这些学习资源作为推荐学习资源推荐给用户。

步骤305:将关联规则算法确定为目标推荐算法,利用关联规则算法及目标用户的特征数据,确定目标用户的相似用户。

步骤306:根据相似用户,确定目标用户的推荐学习资源。

为了完成用户的相关资源推荐,采用关联规则技术中的Apriori算法来挖掘用户之间的关联规则。算法分析的目标包括两项:发现频繁项集和关联规则。首先需要找到频繁项集,然后才能获得关联规则。Apriori算法的两个输入参数分别是最小支持度(min_support)和数据集。该算法会先生成所有单个物品的项集列表,接着扫描数据记录来查看哪些项集满足最小支持度要求,不满足最小支持度的集合被去掉。然后,对剩下的集合进行组合以生成包含两个元素的项集。接下来,再重新扫描交易记录,去掉不满足最小支持度的项集。该过程重复进行直到所有项集都被去掉。

为了完成后续的基于用户的协同过滤分析过程,采用关联规则挖掘技术中常用的Apriori算法来挖掘用户之间的关联规则。关联规则支持度的定义下如公式所示:

support(A→B)=P(A∪B)

其中,P(A∪B表示事务包含集合A和B并集的概率。关联规则的置信度定义如下公式所示:

为了降低生成频繁项集的计算复杂度,需要利用支持度对候选项集进行剪枝,该过程需要遵循如下两条定律:

如果一个集合是频繁项集,则它的所有子集都是频繁项集。例如:假设一个集合{A,B}是频繁项集,即A、B同时出现在一条记录的次数大于等于最小支持度(min_support),则它的子集{A}、{B}出现次数必定大于等于最小支持度,即它的子集都是频繁项集。

如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。例如:假设集合{A}不是频繁项集,即A出现的次数小于最小支持度,则它的任何超集如{A,B}出现的次数必定小于最小支持度,因此其超集必定也不是频繁项集。

利用关联规则挖掘出与目标用户具有强关联规则的关联用户之后,可直接根据关联用户对目标资源的评分,预测出目标用户对该目标资源的评分,目标用户未对该目标资源产生过目标行为,目标行为可包括浏览、学习、收藏、关注、评价、下载等。然后选择预测评分最高的若干项学习资源给目标用户。具体地,确定关联用户对目标资源的评分,再将目标用户与关联用户的相似度的值作为权值,计算各关联用户对目标资源评分的加权和,并将该加权和作为目标用户对该目标资源的预测评分。

在本发明的一个实施例中,目标用户的推荐学习资源的确定方法包括以下步骤:

S01:建立用户评分矩阵,用户评分矩阵中包括用户对学习资源的评分。协同过滤算法的输入数据通常表示为一个用户—评分矩阵,评分值可以是用户的浏览次数,学习次数,收藏次数等,还可以采用显示评分,如用户对资源课程的直接评分或学习次数作为评分。

S02:确定目标用户的至少一个最近邻居。主要完成对目标用户最近邻居的查找,通过计算目标用户与其他用户之间的相似度,算出与目标用户最相似的“最近邻居”集。该过程分两步完成:首先采用余弦值相似度计算方法得到用户之间的相似度,其次是根据如下方法选择“最近邻居”。可将下列符合条件的用户设定为“最近邻居”,包括:选择相似度大于设定阈值的用户;选择相似度最大的前若干个用户;选择相似度大于预定阈值的若干个用户等。

S03:执行上述步骤305,采用关联规则算法,生成目标用户的相似用户结果集。采用关联规则算法挖掘出与目标用户具有强关联规则的用户,加入到S02中得到的邻居集合中,以生成目标用户的相似用户结果集。

S04:产生相关推荐资源结果,计算方法如下:将目标用户与S03中生成的相似用户结果集中的邻居用户的相似度的值作为权值,然后根据邻居用户对目标资源的评分,确定目标用户对目标资源的预测评分。例如,将邻居用户对该资源的评分与此邻居用户的所有评分的差值进行加权平均。将邻居用户对该目标资源的评分与此邻居用户的评分平均值(或中位数)的差值进行加权平均,或计算各关联用户对目标资源评分的加权和的平均值,并将该加权和的平均值作为目标用户对该目标资源的预测评分等。通过上述方法预测出目标用户对未产生评价资源的评分,然后选择预测评分最高的若干项推荐给目标用户。

步骤307:将协同过滤算法确定为目标推荐算法,利用协同过滤算法及目标用户的特征数据,确定目标用户的推荐学习资源。

方式一、根据目标用户的相似用户结果集,确定目标用户的推荐学习资源。该方式的基本思想是根据用户对课程学习资源之间的相似性,搜索目标用户的最近邻居,然后根据最近邻居的评分向目标用户产生推荐。该方式主要分为以下步骤:

S11:建立用户评分矩阵,用户评分矩阵中包括用户对学习资源的评分。协同过滤算法的输入数据通常表示为一个用户—评分矩阵,评分值可以是用户的浏览次数,学习次数,收藏次数等,还可以采用显示评分,如用户对资源课程的直接评分或学习次数作为评分。

S12:确定目标用户的至少一个最近邻居。主要完成对目标用户最近邻居的查找,通过计算目标用户与其他用户之间的相似度,算出与目标用户最相似的“最近邻居”集。该过程分两步完成:首先采用余弦值相似度计算方法得到用户之间的相似度,其次是根据如下方法选择“最近邻居”。可将下列符合条件的用户设定为“最近邻居”,包括:选择相似度大于设定阈值的用户;选择相似度最大的前若干个用户;选择相似度大于预定阈值的若干个用户等。

S13:采用关联规则算法,生成目标用户的相似用户结果集。如采用Apriori算法挖掘出与目标用户具有强关联规则的用户,加入到S02中得到的邻居集合中,以生成目标用户的相似用户结果集。

S14:产生相关推荐资源结果,计算方法如下:将目标用户与S03中生成的相似用户结果集中的邻居用户的相似度的值作为权值,然后根据邻居用户对目标资源的评分,确定目标用户对目标资源的预测评分。例如,将邻居用户对该资源的评分与此邻居用户的所有评分的差值进行加权平均。将邻居用户对该目标资源的评分与此邻居用户的所有评分的平均值(或中位数)的差值进行加权平均,或计算各关联用户对目标资源评分的加权和的平均值,并将该加权和的平均值作为目标用户对该目标资源的预测评分等。通过上述方法预测出目标用户对未产生评价资源的评分,然后选择预测评分最高的若干项学习资源推荐给目标用户。

S15:采用协同过滤算法,如ALS算法迭代计算用户的个性化资源推荐结果。具体过程如下:(1)将稀疏评分矩阵分解为用户特征向量矩阵和资源物品特征向量矩阵的乘积;(2)交替使用最小二乘法逐步计算用户-资源物品特征向量,使均方差最小;(3)通过用户-资源物品特征来预测某个用户对某个资源物品的评分,生成个性化推荐学习资源。

在本发明的一个实施例中,根据S14和S15生成的推荐学习资源集合,生成最终的目标用户的推荐学习资源集合。具体地,可提取两学习资源集合的并集或交集,也可分别从两学习资源集合中提取出若干项学习资源,作为最终的目标用户的推荐学习资源集合。本发明实施例对于如何根据S14和S15生成的推荐学习资源集合,生成最终的目标用户的推荐学习资源集合的方式,不做限定。

方式二、采用ALS算法作为目标推荐算法,确定目标用户的推荐学习资源。具体地,先构建用户-资源-评分的数据矩阵,通过矩阵分解预测每一个用户对资源的喜好程度,完成个性化课程资源的推荐。

ALS算法属于User-Item(用户-物品)协同过滤,即混合协同过滤算法。它同时考虑了用户和物品两个方面。用户和资源物品的关系,可以抽象为如下的三元组:。其中,User代表用户,Item代表资源物品,Rating是用户对资源物品的评分,表征用户对该资源物品的喜好程度。假定系统中包含m个用户和n个资源物品,则定义评分矩阵R

针对上述数据特征,可以假设平台用户和资源物品间存在若干关联维度(年龄,地区,岗位等),只需将评分矩阵R映射到这些特征维度上即可得到如下公式:

其中,k表示隐含因子的维度,取值一般为20到200。X为用户特征向量矩阵,Y为资源物品特征向量矩阵。为了使低秩矩阵X和Y尽可能逼近R,需要最小化下面的平方误差函数公式:

其中,r

本发明实施例的方法能够取得下列有益效果:采用聚类算法实现了新用户的推荐资源生成,解决了推荐系统的冷启动问题;采用关联规则分析技术挖掘了资源物品之间的强关联规则,生成了用户的相关资源推荐结果;采用协同过滤中的ALS算法降低了协同过滤推荐算法的计算复杂度,利用了用户的隐式反馈特征,避免了传统推荐技术中存在的数据稀疏性,提升了资源推荐结果的准确性和实时性。

图4是本发明的一个实施例提供的一种推荐学习资源的确定方法的流程的示意图,如图4所示,该方法包括:

步骤401:确定目标用户的特征数据,特征数据包括:用户兴趣标签。

步骤402:判断用户兴趣标签的个数是否小于第一数目阈值。

若第一判断结果表征所述用户兴趣标签的个数小于第一数目阈值,则执行步骤403;若第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则执行步骤404。

步骤403:将聚类算法确定为目标推荐算法;利用聚类算法及目标用户的特征数据,确定目标用户的推荐学习资源。

步骤404:判断系统中的用户数目是否小于第二数目阈值。

若第二判断结果表征所述系统中的用户数目大于或等于第二数目阈值,则执行步骤405;若第二判断结果表征所述系统中的用户数目小于第二数目阈值,则执行步骤407。

步骤405:将关联规则算法确定为目标推荐算法,利用关联规则算法及目标用户的特征数据,确定目标用户的相似用户。

步骤406:根据相似用户,确定目标用户的推荐学习资源。

步骤407:将协同过滤算法确定为目标推荐算法,利用协同过滤算法及目标用户的特征数据,确定目标用户的推荐学习资源。

在本发明实施例中,分别根据用户兴趣标签的个数和系统中的用户数目,确定目标推荐算法。在系统中的用户数目较多的情况下,通过关联规则确定出目标用户的关联用户,确定出的关联用户与目标用户之间的属性差别较小。因此,通过关联规则算法,可较准确地预测出目标用户的对应的推荐学习资源。

在系统中的用户数目较少的情况下,如果关联规则确定出与目标用户的关联用户,确定出的关联用户可能与目标用户之间的属性差别较大,通过关联用户可能无法较准确地预测出目标用户的对应的推荐学习资源。因此,在系统中的用户数目较少的情况下,采用协同过滤算法以较精准地预测出目标用户的对应的推荐学习资源。

图5是本发明的一个实施例提供的一种推荐学习资源的确定装置的结构示意图,如图5所示,该方法包括:

数据确定模块501,用于确定目标用户的特征数据;

条件判断模块502,用于判断特征数据是否符合第一预设条件;

算法确定模块503,用于根据第一预设条件对应的第一判断结果,确定目标推荐算法;

资源确定模块504,用于利用目标推荐算法及目标用户的特征数据,确定目标用户的推荐学习资源。

可选地,特征数据包括:用户兴趣标签;

条件判断模块502具体用于:

判断用户兴趣标签的个数是否小于第一数目阈值。

可选地,算法确定模块503具体用于:

若第一判断结果表征所述用户兴趣标签的个数小于第一数目阈值,则将聚类算法确定为目标推荐算法;

资源确定模块504具体用于:

利用聚类算法及目标用户的特征数据,确定目标用户的用户群;

根据用户群,确定目标用户的推荐学习资源。

可选地,条件判断模块502具体用于:

若第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则将关联规则算法确定为目标推荐算法;

资源确定模块504具体用于:

利用关联规则算法及目标用户的特征数据,确定目标用户的相似用户;

根据相似用户,确定目标用户的推荐学习资源。

可选地,算法确定模块503具体用于:

若第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则将协同过滤算法确定为目标推荐算法;

资源确定模块504具体用于:

利用协同过滤算法及目标用户的特征数据,确定目标用户的推荐学习资源。

可选地,算法确定模块503具体用于:

若第一判断结果表征所述用户兴趣标签的个数大于或等于第一数目阈值,则判断系统中的用户数目是否符合第二预设条件,第二预设条件包括:系统中的用户数目小于第二数目阈值;

根据第二预设条件对应的第二判断结果,确定目标推荐算法。

可选地,算法确定模块503具体用于:

若第二判断结果表征所述系统中的用户数目大于或等于第二数目阈值,则将关联规则算法确定为目标推荐算法;

资源确定模块504具体用于:

利用关联规则算法及目标用户的特征数据,确定目标用户的相似用户;

根据相似用户,确定目标用户的推荐学习资源。

可选地,算法确定模块503具体用于:

若第二判断结果表征所述系统中的用户数目小于第二数目阈值,则将协同过滤算法确定为目标推荐算法;

资源确定模块504具体用于:

利用协同过滤算法及目标用户的特征数据,确定目标用户的推荐学习资源。

可选地,还包括:

准确率确定模块505,用于获取第一训练集,第一训练集中包括多个学习资源;

获取测试用户在训练集上的第一行为数据;

根据第一行为数据,确定测试用户的第一推荐列表;

利用目标推荐算法、测试用户的特征数据及第一训练集,确定测试用户的第一行为列表;

根据第一推荐列表及第一行为列表,确定推荐学习资源的确定方法的准确率。

可选地,还包括:

召回率确定模块506,用于获取第二训练集,第二训练集中包括多个学习资源;

获取测试用户在训练集上的第二行为数据;

根据第二行为数据,确定测试用户的第二推荐列表;

利用目标推荐算法、测试用户的特征数据及第二训练集,确定测试用户的第二行为列表;

根据第二推荐列表及第二行为列表,确定推荐学习资源的确定方法的召回率。

可选地,数据确定模块501具体用于:

获取目标用户的日志文件;

对日志文件进行预处理,预处理包括以下之一:分词处理、特征词识别、无效字符过滤;

对处理后的日志文件进行统计分析,以确定目标用户的特征数据。

可选地,特征数据包括:显性数据及隐形数据;

显性数据包括以下至少之一:资源评论、资源点赞、资源转发、资源下载、用户评分反馈、下载资源、做题记录、搜索课程资源、与课程互动次数、每次互动时间、系统在线时长;

隐形数据包括以下至少之一:浏览历史、阅读时长、观看记录、搜索日志。

本发明实施例提供了一种电子设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任一实施例的方法。

下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据确定模块、条件判断模块、算法确定模块及资源确定模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,数据确定模块还可以被描述为“确定目标用户的特征数据的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:

确定目标用户的特征数据;

判断所述特征数据是否符合第一预设条件;

根据所述第一预设条件对应的第一判断结果,确定目标推荐算法;

利用所述目标推荐算法及所述目标用户的特征数据,确定所述目标用户的推荐学习资源。

根据本发明实施例的技术方案,将根据目标用户的特征数据是否符合第一预设条件,来确定目标推荐算法;再利用目标推荐算法及目标用户的特征数据,确定目标用户的推荐学习资源。本发明实施例没有采用固定的推荐算法,而是根据用户的特征数据决定目标推荐算法,得到的推荐学习资源更加精准,可更好地满足用户的需要。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号