首页> 中国专利> 基于知识图谱的辅助教学方法、装置、设备及存储介质

基于知识图谱的辅助教学方法、装置、设备及存储介质

摘要

本发明实施例公开了一种基于知识图谱的辅助教学方法、装置、设备及存储介质,涉及人工智能领域,可应用于智慧教育场景中,从而推动智慧城市的建设。所述方法包括:从预存的知识库中提取关键词以及知识点以构建知识图谱;若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。通过构建知识图谱,在获取到从错题文本中提取的待查询关键词后,可从知识图谱中查找关联的知识点组成知识点集合,从而能够快速准确的为教师统计学生薄弱的知识点,使得教师能够快速了解学生的学习情况,进而更准确制定教学计划。

著录项

  • 公开/公告号CN112464659A

    专利类型发明专利

  • 公开/公告日2021-03-09

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202011328117.4

  • 发明设计人 郭俊雄;王健宗;

    申请日2020-11-24

  • 分类号G06F40/289(20200101);G06F16/36(20190101);G06F16/33(20190101);G06Q50/20(20120101);

  • 代理机构44242 深圳市精英专利事务所;

  • 代理人蒋学超

  • 地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 10:08:35

说明书

技术领域

本发明涉及人工智能技术领域,尤其涉及一种基于知识图谱的辅助教学方法、装置、设备及存储介质。

背景技术

随着人们生活水平的不断提高,人们对教育的重视程度越来越高。教师是教育中的重要角色。教师不止要在上课时传授知识,还要明确学生对上课所讲的知识点的掌握情况,从而在帮助学生查漏补缺时进行针对性地辅导。通过平时的作业与考试,教师能够从错题以及分数上了解学生掌握试卷所涉及知识点的程度。

然而教师的时间精力有限,目前普遍的做法是根据自身的经验主观确定学生的知识薄弱点,无法做到精确的统计,因此不能精准地制定教学计划。

发明内容

本发明实施例提供了一种基于知识图谱的辅助教学方法、装置、设备及存储介质,旨在解决教师难以准确了解学生的知识薄弱点的问题。

第一方面,本发明实施例提供了一种基于知识图谱的辅助教学方法,其包括:

从预存的知识库中提取关键词以及知识点;

根据从所述知识库中提取到的关键词以及知识点构建知识图谱;

若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;

从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。

第二方面,本发明实施例还提供了一种基于知识图谱的辅助教学装置,其包括:

第一提取单元,用于从预存的知识库中提取关键词以及知识点;

构建单元,用于根据从所述知识库中提取到的关键词以及知识点构建知识图谱;

第二提取单元,用于若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;

第一发送单元,用于从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。

第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。

本发明实施例提供了一种基于知识图谱的辅助教学方法、装置、设备及存储介质。其中,所述方法包括:从预存的知识库中提取关键词以及知识点;根据从所述知识库中提取到的关键词以及知识点构建知识图谱;若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。通过构建知识图谱,在获取到从错题文本中提取的待查询关键词后,可从知识图谱中查找关联的知识点组成知识点集合,从而能够快速准确的为教师统计学生薄弱的知识点,使得教师能够快速了解学生的学习情况,进而更准确制定教学计划。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于知识图谱的辅助教学方法的应用场景示意图;

图2为本发明实施例提供的一种基于知识图谱的辅助教学方法的流程示意图;

图3为本发明实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;

图4为本发明实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;

图5为本发明实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;

图6为本发明实施例提供的一种基于知识图谱的辅助教学方法的子流程示意图;

图7为本发明另一实施例提供的一种基于知识图谱的辅助教学方法的流程示意图;

图8为本发明实施例提供的一种基于知识图谱的辅助教学装置的示意性框图;

图9为本发明另一实施例提供的一种基于知识图谱的辅助教学装置的示意性框图;

图10为本发明实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

请参阅图1和图2,图1为本发明实施例提供的基于知识图谱的辅助教学方法的应用场景示意图。图2为本发明实施例提供的基于知识图谱的辅助教学方法的示意性流程图。该基于知识图谱的辅助教学方法应用于服务器2中。服务器2从预存的知识库中提取关键词以及知识点;服务器2根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点;若接收到终端1发送的错题文本,服务器2从错题文本中提取待查询关键词;服务器2从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端1。

图2是本发明实施例提供的基于知识图谱的辅助教学方法的流程示意图。本发明可应用于智慧教育场景中,从而推动智慧城市的建设。如图所示,该方法包括以下步骤S1-S4。

S1,从预存的知识库中提取关键词以及知识点。

具体实施中,知识库是指某一教学阶段的某一学科的知识内容组成的集合。例如,初中数学知识库是指初中阶段的数学的知识内容组成的集合。

知识库由多个知识文本组成,知识文本是指介绍某一知识内容的文本。例如,在初中数学知识库中,关于二次函数的知识文本如下:形如y=ax

关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如对于上述关于二次函数的知识文本,其关键词为:二次函数。

知识点是指知识文本的摘要,通过从知识文本中摘取重要的语句得到,例如对于上述关于二次函数的知识文本,其知识点为:形如y=ax

具体实施中,分别从知识库的各知识文本中提取关键词以及知识点,用以构建知识图谱。

参见图3,在一实施例中,知识库包括知识文本,以上步骤S1具体包括如下步骤:

S11,对知识文本进行分词处理以得到第一分词集合。

具体实施中,分词处理是指将输入语料划分为多个词语组成的序列。可具体通过预设的分词工具(例如,jieba分词工具)对知识文本进行分词处理得到第一分词集合。

例如,在一实施例中,知识文本为:按一定次序排列的一列数称为数列。

经过分词处理后得到的第一分词集合为(按,一定,次序,排列,的,一列,数,称为,数列)。

S12,将第一分词集合中的停止词删除,并将第一分词集合中剩余的词语作为第一候选关键词。

具体实施中,停止词(stop word),常为介词、副词或连词等。例如,"在"、"里面"、"也"、"的"、"它"、"为"等都为停止词。停止词本身没有实际含义,因此本实施例的技术方案中,将第一分词集合中的停止词删除,以减少计算量。

例如,在一实施例中,第一分词集合为(按,一定,次序,排列,的,一列,数,称为,数列)。其包括停止词“的”,将停止词删除后得到的第一候选关键词包括(按,一定,次序,排列,一列,数,称为,数列)。

S13,判断第一候选关键词是否属于预设的关键词集合。

具体实施中,关键词集合由本领域技术人员,例如教师,根据经验确定,关键词集合中的关键词通常为专业的术语。例如对于初中数学知识库,其关键词包括二次函数、三角函数、顶点以及数列等。

在得到第一候选关键词后,逐一判断各第一候选关键词是否属于预设的关键词集合。

S14,若第一候选关键词属于预设的关键词集合,判定第一候选关键词为知识文本的关键词。

进一步地,若第一候选关键词不属于预设的关键词集合,判定第一候选关键词不是知识文本的关键词。

例如,在一实施例中,第一候选关键词包括(按,一定,次序,排列,一列,数,称为,数列)。关键词集合为(二次函数,三角函数,顶点,数列)。经过判断可知,只有“数列”属于关键词集合。因此,判定“数列”为关键词,“按”、“一定”、“次序”、“排列”、“一列”、“数”以及“称为”均不是关键词。

参见图4,在本实施例中,以上步骤S1还包括如下步骤:

S101,将知识文本划分为多个候选句子。

具体实施中,根据标点符号将知识文本拆分成若干个候选句子,例如,根据句号、问号以及感叹号进行拆分。

在一实施例中,关于二次函数的知识文本如下:形如y=ax

根据标点符号拆分后得到如下候选句子:

候选句子1:形如y=ax

候选句子2:其中a称为二次项系数,b为一次项系数,c为常数项。

候选句子3:x为自变量,y为因变量。

候选句子4:等号右边自变量的最高次数是2。

S102,通过预设的TextRank算法分别计算各候选句子的权重。

具体实施中,TextRank是一种利用局部词汇之间关系对句子进行排序和抽取的算法,通过句子的相似度经过多次迭代传播从而得到句子的权重。其基本思想来源于谷歌的PageRank算法,在把文本分割成若干组成单元(句子)并建立图模型后,利用投票机制对文本中的重要成分进行排序,得到各句子的权重。

例如,在一实施例中,知识文本总共包括四个候选句子,则通过TextRank算法分别计算这四个候选句子的权重。

S103,按照权重由高到低的顺序选取预设数量的候选句子组成知识文本的知识点。

具体实施中,预设数量可由本领域技术人员进行设定,对比本发明不作具体限定。权重越高,说明候选句子的重要程度越高,越适合作为知识点(摘要)。

例如,在一实施例中,预设数量设定为1。知识文本总共包括四个候选句子,具体如下:

候选句子1:形如y=ax

候选句子2:其中a称为二次项系数,b为一次项系数,c为常数项。

候选句子3:x为自变量,y为因变量。

候选句子4:等号右边自变量的最高次数是2。

经过计算后得到,候选句子1的权重最高,则选择候选句子1作为知识文本的知识点。

可以理解地,以上步骤S11-S14与S101-S103之间是相互独立的,相互间没有执行的先后顺序,或者二者可并行执行。

S2,根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点。

具体实施中,知识图谱是图的一种。图(Graph)是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E),其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合。

图是一种比线性表和树更复杂的数据结构。在图中,顶点之间的关系是任意的,任意两个顶点之间都可能相关。

图是一种多对多的数据结构。它包含顶点集合和边集合两部分,边反映了顶点之间的关系。若图的两个顶点之间存在关联,则该两个顶点之间存在边;若图的两个顶点之间不存在关联,则该两个顶点之间不存在边。

本实施例构建的知识图谱以从知识库中提取到的关键词以及知识点为顶点,并且在任意两个存在关联的关键词与知识点之间建立边。

在一实施例中,以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到知识图谱。

同一个知识文本的关键词和知识点之间必然存在关联,因此在二者之间建立边。

S3,若接收到终端发送的错题文本,从错题文本中提取待查询关键词。

具体实施中,错题文本是指错题组成的文本。例如,学生(一个或者多个)在某次考试中的错题组成的文本。错题文本的示例如下:1、计算二次函数y=3x

待查询关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如对于上述错题文本,其关键词为:二次函数、顶点。

参见图5,在一实施例中,以上步骤S3具体包括:

S31,对错题文本进行分词处理以得到第二分词集合。

具体实施中,分词处理是指将输入语料划分为多个词语组成的序列。可具体通过预设的分词工具(例如,jieba分词工具)对错题文本进行分词处理得到第二分词集合。

例如,在一实施例中,错题文本为:计算二次函数y=3x

经过分词处理后得到的第二分词集合为(计算,二次函数,y=3x

S32,将第二分词集合中的停止词删除,并将第二分词集合中剩余的词语作为第二候选关键词。

具体实施中,停止词(stop word),常为介词、副词或连词等。例如,"在"、"里面"、"也"、"的"、"它"、"为"等都为停止词。停止词本身没有实际含义,因此本实施例的技术方案中,将第二分词集合中的停止词删除,以减少计算量。

例如,在一实施例中,第二分词集合为(计算,二次函数,y=3x

S33,判断第二候选关键词是否属于预设的关键词集合。

具体实施中,关键词集合由本领域技术人员,例如教师,根据经验确定,关键词集合中的关键词通常为专业的术语。例如对于初中数学知识库,其关键词包括二次函数、三角函数、顶点以及数列等。

在得到第二候选关键词后,逐一判断各第二候选关键词是否属于预设的关键词集合。

S34,若第二候选关键词属于预设的关键词集合,判定第二候选关键词为错题文本的待查询关键词。

进一步地,若第二候选关键词不属于预设的关键词集合,判定第二候选关键词不是错题文本的关键词。

例如,在一实施例中,第二候选关键词包括(计算,二次函数,y=3x

S4,从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端。

具体实施中,从知识图谱中获取与待查询关键词通过边相连的知识点组成知识点集合,并将得到的知识点集合发送给终端,从而便于教师了解学生薄弱的知识点在哪,进而更准确规划教学内容。

参见图6,在一实施例中,待查询关键词的数量为多个,知识图谱包括边和顶点,其中,顶点包括关键词以及知识点,边包括关键词以及知识点的连接关系,以上步骤S4具体包括如下步骤:

S41,判断各待查询关键词是否均为知识图谱的顶点。

具体实施中,逐一判断各待查询关键词是否为知识图谱的顶点。即判断各待查询关键词是否为知识图谱的顶点集合的元素。

S42,若各待查询关键词均是知识图谱的顶点,从知识图谱中获取与各待查询关键词通过边相连的知识点。

例如,在一实施例中,总共有两个待查询关键词,分别为关键词1与关键词2。关键词1与关键词2均为知识图谱的顶点。知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。

S43,对与各待查询关键词通过边相连的知识点进行去重处理以得到知识点集合。

具体实施中,去重处理是指将相同的知识点只保留一个,从而能够有效避免重复。

例如,在一实施例中,知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。知识点2是重复的,只保留一个即可。因此得到的知识点集合为(知识点1、知识点2、知识点3)

S44,若部分待查询关键词是知识图谱的顶点,将不是知识图谱的顶点的待查询关键词删除,从知识图谱中获取与剩余的待查询关键词通过边相连的知识点。

例如,在一实施例中,总共有两个待查询关键词,分别为关键词1、关键词2以及关键词3。其中,关键词1与关键词2是知识图谱的顶点。关键词3不是知识图谱的顶点。因此将关键词3删除,剩余的待查询关键词为关键词1与关键词2。

知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。

S45,对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到知识点集合。

具体实施中,去重处理是指将相同的知识点只保留一个,从而能够有效避免重复。

例如,在一实施例中,剩余的待查询关键词为剩余的待查询关键词为关键词1与关键词2。

知识图谱中与关键词1通过边相连的知识点为知识点1以及知识点2。知识图谱中与关键词2通过边相连的知识点为知识点2以及知识点3。知识点2是重复的,只保留一个即可。因此得到的知识点集合为(知识点1、知识点2、知识点3)。

进一步地,若所有的待查询关键词都不是知识图谱的顶点,则向终端返回无查询结果提示消息,以提示用户未找到查询结果,并核对输入的错题文本是否正确。

本发明实施例的技术方案,从预存的知识库中提取关键词以及知识点;根据从知识库中提取到的关键词以及知识点构建知识图谱,知识图谱的顶点包括关键词以及知识点;若接收到终端发送的错题文本,从错题文本中提取待查询关键词;从知识图谱中获取与待查询关键词关联的知识点组成知识点集合,并将知识点集合发送给终端。通过构建知识图谱,在获取到从错题文本中提取的待查询关键词后,可从知识图谱中查找关联的知识点组成知识点集合,从而能够快速准确的为教师统计学生薄弱的知识点,使得教师能够快速了解学生的学习情况,进而更准确制定教学计划。

图7是本发明另一实施例提供的一种基于知识图谱的辅助教学方法的流程示意图。如图7所示,本实施例的基于知识图谱的辅助教学方法包括步骤S71-S75。其中步骤S71-S74与上述实施例中的步骤S1-S4类似,在此不再赘述。下面详细说明本实施例中所增加的步骤S75。

S75,获取与待查询关键词关联的试题组成试题集合,并将试题集合发送给终端。

具体实施中,关键词通常由本领域的专业技术人员设定,期通常为一些惯用的术语,例如:二次函数以及数列等。

预先为关键词配套准备试题,并储存到数据库中。在得到候选关键词后,从数据库中查询与待查询关键词关联的试题组成试题集合。通过将试题集合发送给终端,使得老师能够通过这些试题提高学生对相关知识点的掌握程度。

参见图8,图8是本发明实施例提供的一种基于知识图谱的辅助教学装置70的示意性框图。对应于以上基于知识图谱的辅助教学方法,本发明还提供一种基于知识图谱的辅助教学装置70。该基于知识图谱的辅助教学装置70包括用于执行上述基于知识图谱的辅助教学方法的单元,该基于知识图谱的辅助教学装置70可以被配置于服务器中。具体地,该基于知识图谱的辅助教学装置70包括第一提取单元71、构建单元72、第二提取单元73以及第一发送单元74。

第一提取单元71,用于从预存的知识库中提取关键词以及知识点;

构建单元72,用于根据从所述知识库中提取到的关键词以及知识点构建知识图谱;

第二提取单元73,用于若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;

第一发送单元74,用于从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。

在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:

对所述知识文本进行分词处理以得到第一分词集合;

将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;

判断所述第一候选关键词是否属于预设的关键词集合;

若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。

在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:

将所述知识文本划分为多个候选句子;

通过预设的TextRank算法分别计算各所述候选句子的权重;

按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。

在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:

以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。

在一实施例中,所述从所述错题文本中提取待查询关键词,包括

对所述错题文本进行分词处理以得到第二分词集合;

将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;

判断所述第二候选关键词是否属于预设的关键词集合;

若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。

在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:

判断各所述待查询关键词是否均为所述知识图谱的顶点;

若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;

对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;

若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;

对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。

图9是本发明另一实施例提供的一种基于知识图谱的辅助教学装置70的示意性框图。如图9所示,本实施例的基于知识图谱的辅助教学装置70是上述实施例的基础上增加了第二发送单元75。

第二发送单元75,用于获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。

需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于知识图谱的辅助教学装置70和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。

上述基于知识图谱的辅助教学装置70可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。

请参阅图10,图10是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500是服务器。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。

该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种基于知识图谱的辅助教学方法。

该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种基于知识图谱的辅助教学方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,上述结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:

从预存的知识库中提取关键词以及知识点;

根据从所述知识库中提取到的关键词以及知识点构建知识图谱;

若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;

从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。

在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:

对所述知识文本进行分词处理以得到第一分词集合;

将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;

判断所述第一候选关键词是否属于预设的关键词集合;

若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。

在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:

将所述知识文本划分为多个候选句子;

通过预设的TextRank算法分别计算各所述候选句子的权重;

按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。

在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:

以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。

在一实施例中,所述从所述错题文本中提取待查询关键词,包括

对所述错题文本进行分词处理以得到第二分词集合;

将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;

判断所述第二候选关键词是否属于预设的关键词集合;

若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。

在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:

判断各所述待查询关键词是否均为所述知识图谱的顶点;

若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;

对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;

若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;

对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。

在一实施例中,处理器502在实现所述从所述错题文本中提取待查询关键词步骤之后,还实现如下步骤:

获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。

应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。

因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行如下步骤:

从预存的知识库中提取关键词以及知识点;

根据从所述知识库中提取到的关键词以及知识点构建知识图谱;

若接收到终端发送的错题文本,从所述错题文本中提取待查询关键词;

从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,并将所述知识点集合发送给终端。

在一实施例中,所述知识库包括知识文本,所述从预存的知识库中提取关键词以及知识点,包括:

对所述知识文本进行分词处理以得到第一分词集合;

将所述第一分词集合中的停止词删除,并将所述第一分词集合中剩余的词语作为第一候选关键词;

判断所述第一候选关键词是否属于预设的关键词集合;

若所述第一候选关键词属于预设的关键词集合,判定所述第一候选关键词为所述知识文本的关键词。

在一实施例中,所述从预存的知识库中提取关键词以及知识点,还包括:

将所述知识文本划分为多个候选句子;

通过预设的TextRank算法分别计算各所述候选句子的权重;

按照权重由高到低的顺序选取预设数量的候选句子组成所述知识文本的知识点。

在一实施例中,所述根据从所述知识库中提取到的关键词以及知识点构建知识图谱,包括:

以知识文本的关键词以及知识点作为知识图谱的顶点,并且在同一个知识文本的关键词和知识点之间建立边得到所述知识图谱。

在一实施例中,所述从所述错题文本中提取待查询关键词,包括

对所述错题文本进行分词处理以得到第二分词集合;

将所述第二分词集合中的停止词删除,并将所述第二分词集合中剩余的词语作为第二候选关键词;

判断所述第二候选关键词是否属于预设的关键词集合;

若所述第二候选关键词属于预设的关键词集合,判定所述第二候选关键词为所述错题文本的待查询关键词。

在一实施例中,所述待查询关键词的数量为多个,所述知识图谱包括边和顶点,其中,所述顶点包括所述关键词以及所述知识点,所述边包括所述关键词以及所述知识点的连接关系,所述从所述知识图谱中获取与所述待查询关键词关联的知识点组成知识点集合,包括:

判断各所述待查询关键词是否均为所述知识图谱的顶点;

若各所述待查询关键词均是所述知识图谱的顶点,从所述知识图谱中获取与各所述待查询关键词通过边相连的知识点;

对与各所述待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合;

若部分待查询关键词是所述知识图谱的顶点,将不是所述知识图谱的顶点的待查询关键词删除,从所述知识图谱中获取与剩余的待查询关键词通过边相连的知识点;

对与剩余的待查询关键词通过边相连的知识点进行去重处理以得到所述知识点集合。

在一实施例中,所述处理器在执行所述计算机程序而实现所述从所述错题文本中提取待查询关键词步骤之后,还实现如下步骤:

获取与所述待查询关键词关联的试题组成试题集合,并将所述试题集合发送给终端。

所述存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。所述计算机可读存储介质可以是非易失性,也可以是易失性。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号