首页> 中国专利> 一种基于建构学习理论的个性化即时学习支持系统与方法

一种基于建构学习理论的个性化即时学习支持系统与方法

摘要

本发明提供了一种基于建构学习理论的个性化即时学习支持系统与方法,包括用户知识需求行为分析及记录、标签关系图微知识库、基于建构学习的微知识推荐算法等模块。系统实现从个人用户社交媒体信息中分析其知识的建构需求,然后即时为其推荐学习个性化的微知识,从而主动快速地帮助用户弥补知识缺陷。本发明所述方法能够作为互联网社交系统的一个重要服务内容,智能高效地帮助用户提升个人知识素养,取得良好的经济和社会效益。

著录项

  • 公开/公告号CN104866557A

    专利类型发明专利

  • 公开/公告日2015-08-26

    原文格式PDF

  • 申请/专利权人 江南大学;

    申请/专利号CN201510252479.2

  • 申请日2015-05-18

  • 分类号G06F17/30(20060101);

  • 代理机构

  • 代理人

  • 地址 214122 江苏省无锡市滨湖区蠡湖大道1800号

  • 入库时间 2023-12-18 10:36:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-20

    授权

    授权

  • 2015-09-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150518

    实质审查的生效

  • 2015-08-26

    公开

    公开

说明书

技术领域

本发明公开了一种社交网络中用户知识需求分析,个性化即时知识推荐的 系统与方法,属于个性化知识推荐的领域。

背景技术

现如今,人们日常生活越来越离不开社交网络。单就新浪微博数据显示,截 止2014年十月,微博月活跃用户数已经达到1.67亿人。人们通过社交网络来实现 信息传播、信息分享、信息获取。本文以新浪微博这一社交网络为平台进行说 明。

微博功能日益强大,大量增长的微博信息在给人们带来方便的同时也造成了 信息过载等问题。用户每天接收的微博数据中包含了各个知识领域的不同知识, 同时包含大量与学术知识毫不相干的无用信息,导致用户在“刷微博”的时候 需要主动过滤大量的不相干信息,筛选有用的信息来阅读,大大增加了用户刷 微博时的负担。

此外,对于一些未曾接触过的陌生知识,用户通过在搜索引擎中输入关键词 来检索相关的网页,然后从中选择有价值的网页来阅读。因此用户每学习一条 新知识都将经历繁琐的检索筛选过程,并且这个过程并不能确保用户最终检索 到的内容是自己感兴趣的。因此用户“刷微博”是一个走马观花,漫无目的的 学习过程,没有一个系统的规划,这可能导致用户重复学习,花费多余的时间。

如何帮助微博用户筛选有效的信息,过滤无用的、不感兴趣的信息,并在此 基础上分析用户的兴趣爱好,给用户作出个性化的学习推荐,是一个亟待解决 的问题。

学习推荐系统在一定程度上解决了以上提出的问题。但现有的学习推荐系统 还存在一些不足之处:①不能实时获取用户的学习兴趣。②推荐内容用户感兴 趣程度不高。③学习内容形式复杂,导致学习负担重,降低用户学习兴趣。④ 没有针对用户系统全面的学习规划。

针对以上不足,本发明公布了一种基于建构学习理论的个性化即时学习支持 系统与方法。

发明内容

本发明旨在弥补上述学习推荐系统的不足,它提供了一种社交网络中根据用 户知识需求即时给用户推荐个性化学习资源的学习推荐系统。本发明重在为用 户营造一个个性化的学习环境,帮助用户即时发现学习兴趣点,弥补知识缺陷, 建构完整的知识结构。本发明着重考虑两点:①实时动态分析用户知识需求, 发现用户期望的知识缺失,即时推荐学习资源。②通过引入有向标签关系图, 实现基于建构的学习资源推荐。

本发明提供的基于微知识建构的个性化即时学习支持系统与方法,包括以下 步骤:

用户知识背景分析:首先通过获取大量微博认证用户的微博标签,统计分析 不同人群对不同微博标签的喜好,然后通过分析目标用户的微博标签预测该用 户所属人群,进而预测目标用户对哪些知识领域感兴趣。然后批量获取用户及 其关注好友最新发表的微博状态,按发表的时间先后整合成一个微博状态文档, 运用改进的TF-IDF算法自动提取文档关键词。最终得到一组带权重的关键词, 表示用户当前关注的知识点,即为用户的知识背景。

构建有向标签关系图:有向标签关系图存储了所有知识点之间存在的一种内 在联系,即知识内容上的包含、互斥等关系。整个标签关系图的知识结构是一 个网状的结构。标签关系图包含的内容可以分为几个大的知识领域,每一个知 识领域的知识结构是树形结构。每一个大的知识领域由一个知识的根结点一层 层的往下细分,最后形成一个树形结构。

构建扩展知识库:扩展知识库是为了满足用户对知识的进一步需求,当用户 对系统推荐的微知识感兴趣时,系统将给用户推荐针对该微知识的扩展知识, 这可能是一个和该微知识相关的网站,或者是一篇文章。

发现用户期望的缺失知识:用户在刷微博的同时学到的知识是零散的不全面 的,存在知识的缺失。有向标签关系图提供的是一个完整的知识结构体系,相 当于为用户制定了一个全面的学习计划。将用户当前关注的知识点标记在标签 关系图中,从中发现与用户当前关注知识点密切相关的但是是用户未曾接触过 的知识,推荐给用户学习,从而帮助用户达到知识查漏补缺的目的。

实现基于建构的学习资源推荐:将用户期望的缺失知识作为待推荐知识,推荐 给用户学习。用户学习缺失知识的过程就是一个构建知识的过程。用户每学习 一个缺失知识,用户的知识结构就会更加完善。

附图说明

图1学习推荐方法流程图;

图2用户知识背景分析流程图

图3用户所属人群预测流程图

图4用户性别预测流程图

图5获取目标用户微博标签流程图

图6用户年龄预测流程图

图7用户职业预测流程图

图8用户当前关注知识分析流程图

图9标签关系图

图10标签关系图树形分支

图11创建微知识库流程图

图12发现缺失的知识流程图

图13系统架构图

图14系统工作流程图

具体实施方式

下面参照附图来对本发明中的各个步骤进行详细描述。

如图1所示,本发明提供了一种基于建构学习理论的个性化即时学习支持 方法,包括如下步骤:

用户知识背景分析:通过预测用户所属人群和发现用户当前关注的知识来 分析用户知识背景。如图2所示,用户知识背景分析包括如下步骤:

用户所属人群预测:运用贝叶斯定理通过微博标签预测用户所属人群。如图 3所示,用户所属人群预测包括以下步骤:

用户性别预测:通过微博标签预测该用户性别。如图4所示,用户性别预测 包括以下步骤:

获取大量微博认证用户的性别和标签:通过微博开放平台提供的API获取大 量微博认证用户的信息(包括用户性别、年龄、职业、微博标签,发表过的微 博状态)。

按性别统计标签:将所有获取的微博用户标签按男性和女性划分,得到男性 喜爱的微博标签库和女性喜爱的微博标签库。

扩充标签库:如果某一个关键词在用户的微博状态中频繁的出现,则可以认 为该关键词是该用户的微博标签。统计所有男性用户发表过的微博状态,通过 微博去噪,分词,统计词频,将词频较高的关键词作为男性喜爱的微博标签添 加到男性喜爱的微博标签库。统计所有女性用户发表过的微博状态,用同样方 法将词频较高的关键词作为女性喜爱的微博标签添加到女性喜爱的微博标库。

计算每一个标签出现的概率:分别统计男性喜爱的微博标签库和女性喜爱的 微博标签库中每一个标签出现的概率。假设男性喜爱的微博标签库总共有Tm个 标签,女性喜爱的微博标签库总共有Tw个标签,其中标签X在男性喜爱的微博 标签库中出现Sm次,在女性喜爱的微博标签库中出现Sw次,则标签X在男性喜 爱的微博标签库中出现的概率为Sm/Tm,在女性喜爱的微博标签库中出现的概 率为Sw/Tw。

获取目标用户的微博标签:通过用户自身标记的微博标签,用户好友标记的 微博标签、用户发表及转发的微博发现用户喜爱的标签。如图5所示,获取目标 用户微博标签包括以下步骤:

直接获取用户微博标签:通过微博开放平台提供的API获取目标用户的微博 标签。

通过用户关注好友获取微博标签:关注好友是用户主动选择的,通常情况与 目标用户有相似的兴趣喜好。获取关注好友的微博标签,统计出现频率较高的 微博标签作为目标用户喜爱的微博标签。

通过用户发表的微博状态发现微博标签:用户发表转发的状态中如果频繁出 现一些关键词,那么认为这些频繁出现的关键词是用户喜爱的微博标签。

目标用户性别预测:运用贝叶斯定理分析预测目标用户可能的性别。假设Li 是目标用户喜爱的微博标签,则根据贝叶斯定理,可以计算标签Li出现时目标用 户为男性(女性)的概率。假设,男性和女性喜爱某一个标签的初始概率为50%, 公式如下:

P(Men|Li)=P(Men)*P(Li|Men)P(Li|Men)*P(Men)+P(Li|Women)*P(Women)

上式基于一个标签分析了目标用户为男性(女性)的概率。一般情况一个微博 用户喜爱的微博标签有若干个,综合考虑目标用户喜爱的每一个微博标签,最 终的概率计算公式采用下式:(设Pi=P(Men|Li))

P(Men|Ln)=P1*P2...*PnP1*P2*...*Pn+(1-P1)*(1-P2)*...*(1-P3)

通过以上分析,最终获得目标用户为男性用户和为女性用户的概率。比较两个 概率的大小,如果目标用户为男性用户的概率大于目标用户为女性的概率,则 认为目标用户为男性,反之,则认为目标用户为女性。

用户年龄预测:如图6所示为用户年龄预测流程图,具体步骤参见用户性别 预测。

用户职业预测:如图7所示为用户职业预测流程图,具体步骤参见用户性别 预测。

从用户所属人群预测结果获知用户知识兴趣偏好。

用户当前关注知识点分析:通过微博开放平台提供的API获取用户及其关注 好友最新发表的微博状态,从中分析用户当前关注的知识点。如图所示8,用户 当前关注知识分析包括以下步骤:

获取用户及其关注好友最新发表的微博状态:通过微博开放平台提供的API 获取用户及其关注好友最新发表的微博状态,并按照发表的时间先后将微博状 态整合在一个文档中。

微博数据去噪:去除微博数据中的表情符、链接、昵称、话题等无效信息。

微博分词:运用中科院提供的ICT分词器对微博文档进行分词。

分词结果去噪:去除分词结果中的形容词,副词,停用词等无效信息,获得 一组有效的关键词(每一个有效的关键词对应一个相关知识点)。

关键词分析:运用TF-IDF算法分析计算每一个关键词的权重。对文档中的第 i个关键词权重Wi计算公式如下式:

Wi=tfimaxtfi*logNni+1*logDdi

其中tfi表示文档中第i个关键词出现的词频,max tfi表示文档中重复出现最多的关 键词,N表示语料库的文档总数,ni表示语料库中包含该关键词的文档数,D表 示整篇文档的长度,di表示第i个关键词首次出现的位置距离文档开头的长度。 TF-IDF算法的思想包括两点:第一点,关键词出现的词频越高,其权重越大; 第二点,关键词越常见,其权重越小。如果一个关键词很少在其他文档中出现, 而在该文档中频繁出现,则代表这个关键词很能反映该文档的特征。在原有 TF-IDF算法的基础上,本发明结合微博状态的特点考虑每一个关键词发表对应 的时间先后,发表时间越短的关键词,其权重越大。发表时间的长短在文档中 表现为该关键词到文档开头的距离长度。

通过用户兴趣偏好调整关键词权重:通过预先获知的用户知识兴趣偏好调整 知识点权重。每一个知识点判断是否是该用户所属人群喜爱的知识点,如果是, 则加强该知识点权重,如果否,则削弱该知识点权重。例如,“篮球”是男性 用户更加喜爱的关键词,如果目标用户是男性,则用相应的概率加强该关键词 的权重,如果目标用户是女性,则用相应的概率减弱关键词的权重。关键词最 终的权重计算公式如下:

Wi=tfimaxtfi*logNni+1*logDdi*n*PiΣj=1nPj

Pi表示目标用户所在人群选择该关键词的概率,Pj表示不同人群选择该关键词的 概率。等式右边最后一项表示目标用户对该关键词的选择概率与人群选择该关 键词的平均概率的比较。

通过以上步骤最终获得一组带权重的关键词,每一个关键词对应一个知识 点,这些知识点即为用户当前最关注的知识点。

标签关系图和微知识库:标签关系图和微知识库需要人工创建,标签关系图 实现知识结构化存储并提供知识关系,微知识库用于存储人工创建的微知识条 目。标签关系图和微知识库包括以下步骤:

构建有向标签关系图:知识之间存在包含和互斥的关系,将这种知识关系和 对应的知识点存储在标签关系图中。如图9所示,整个标签关系图包含了所有的 知识点,以及各知识点之间存在的包含和互斥关系。

知识分类:利用爬虫从网络上抓取大量的关键词,将关键词按所属的知识 领域分成几类,合并同义关键词。如图9所示,图中外圈五个虚线圆圈,每一 个圆圈代表一个知识领域。

知识分层:如图10所示,将每一个知识领域的关键词以树形结构的形式展 现。不同的关键词覆盖的知识面范围不同。根结点(第一层)的关键词覆盖了 整个知识领域的知识面;由根结点继承的子结点(第二层)的关键词将该知识 领域细分成几个知识块;从不同的知识块继承的子结点(关键词)将每一个知 识块划分成一系列更详细的知识点(第三层);依次按层往下细分,直到知识 点不能再细分,由此得到一个有层级方向的能表示某一知识领域的树形结构的 关键词组。如图9所示,两个粗虚线圆圈代表知识分层,从图中可以看出外层 的知识是从内层的知识继承的。

知识结构化存储:每一个结点表示一个知识点,结点之间的从属和并列关 系对应知识点之间存在的包含和互斥关系。实现知识的结构化存储。如图9所 示,图中每一个实线的小圆圈都表示一个知识点,小圆圈之间的连线表示知识 点之间存在的联系。

标签关系图自动更新:标签关系图中的知识点和知识结构在使用过程中可以 不断自动更新改进。用户在使用过程中发现知识点表达不准确可以进行编辑修 改,如果发现有遗漏的知识点用户也可以按照给定的格式(标题+300-500字的内 容)自己创建一个词条提交给系统。

创建微知识库:标签关系图中的每一个知识点对应创建一个微知识,形成微 知识库。如图11所示,创建微知识库包括以下步骤:

搜索引擎检索微知识:以微知识的标题作为关键词输入搜索引擎,从百度 百科、维基百科、中国百科网获取与该微知识相关的知识条目。

整合检索结果:将获取的检索结果进行整合,合并重复的内容,每一个知 识点整合成一个300字左右的简短内容。

存储微知识:每一条微知识以检索关键词为标题,整合的内容为知识体, 存储在微知识库。

发现缺失的知识:通过用户当前感兴趣的知识点来帮助用户发现缺失的知 识,并为用户推荐相应的知识点,弥补知识的不足。缺失的知识表示用户不能 主动发现的知识点,但这部分知识是和用户目前关注的知识点密切相关的,极 有可能是用户所需的知识点。如图12所示,发现缺失的知识包括以下步骤:

在标签关系图中标记用户知识背景:将用户背景知识(当前最关注的知识 点)在标签关系图中进行标记。

发现缺失的知识:通过标签关系图提供的知识点之间存在的关系,发现与 用户当前关注的知识点关系密切的其他知识点,即为用户期望的缺失知识。

构建与推荐:本发明帮助用户在原有知识背景的基础上,发现期望的缺失知 识,通过不断的推荐学习缺失的知识,建构新的知识体系。建构与推荐包括以 下步骤:

确定待推荐知识:每一个用户关注的知识点都能发现一个相应的缺失知识, 将用户期望的缺失知识top3作为待推荐知识。

确定待推荐扩展知识:根据用户上一次登录系统的学习反馈,如果用户对推 荐的某个知识点表示感兴趣,则将该知识点的扩展知识作为待推荐扩展知识。

推荐知识:将待推荐知识和待推荐扩展知识推荐给用户学习。

建构知识:通过帮助用户不断的发现缺失知识,推荐给用户学习,逐步帮助 用户弥补知识不足,最终实现知识建构。

本发明还公开了一种基于建构学习理论的个性化即时学习支持系统,包括:

如图13所示为系统架构图,展示了本系统各模块的组成,如图14所示为系 统工作流程图,展示了系统工作时的整个流程。

本系统由界面设计模块,推荐算法模块,数据库设计模块三部分组成。

界面设计模块包括登陆界面、知识学习界面、学习反馈界面。

登陆界面:用户凭借社交平台现有账户登陆本系统,系统通过账户名唯一 标识当前登陆的用户。

知识学习界面:显示三条用户可能感兴趣的微知识,推荐给用户学习。

学习反馈界面:用户在学习完推荐的知识后可进行反馈,对推荐的知识进 行评价,用户在下次登录系统时系统根据用户以往的反馈给用户推荐相应的扩 展知识。

推荐算法模块包括用户知识背景分析、发现缺失知识、推荐与建构三部分。

用户知识背景分析:系统获得社交网络授权,提取用户社交信息,预测用 户所属人群,分析用户当下关注的知识点,从而准确了解用户的知识背景。

发现缺失知识:以用户当前关注的知识作为用户的知识背景,利用标签关 系图发现用户可能缺失的知识点。

推荐学习资源:每次登陆系统给用户推荐三条缺失的微知识。

数据库设计模块包括标签关系图、微知识库、扩展知识库三部分。

标签关系图:标签关系图中存储了所有知识点,以及知识点之间存在的联 系。记录每一条知识点的标题、从哪个知识点继承、派生了哪些知识点。

微知识库:存储所有的知识点,每一个知识点存储其标题和简短的知识内 容。微知识库中所有的知识标题和标签关系图中的知识标题一一对应。

扩展知识库:扩展知识库存储所有的扩展知识,当用户对某一个知识点表 示感兴趣时,系统会在用户下次登录时给用户推荐针对该知识点的扩展知识。 扩展知识形式包括详细的知识介绍、相关网站、相关论坛、相关书籍等。

本发明提出一种基于建构学习理论的个性化即时学习支持系统与方法,从 用户的社交信息中分析用户感兴趣的知识,并以此作为用户的知识背景,运用 标签关系图提供的知识之间的联系,帮助用户发现缺失的知识,在用户刷微博 的同时以微知识的形式推荐给用户学习,为用户提供了个性化的知识服务,帮 助用户免去了检索知识的时间,弥补了知识的缺陷。

实际使用

该发明中所描述的方法能够作为互联网中社交网络的一个功能模块,也能 作为以文本为主的学习网站的核心实现方法,旨在给用户推荐个性化的学习知 识,引导用户发现自己的学习兴趣。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号