公开/公告号CN107545791A
专利类型发明专利
公开/公告日2018-01-05
原文格式PDF
申请/专利权人 广州思涵信息科技有限公司;
申请/专利号CN201710758061.8
申请日2017-08-29
分类号G09B5/06(20060101);G06F17/30(20060101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人林丽明
地址 510640 广东省广州市天河区金颖路1号金颖大厦1705房
入库时间 2023-06-19 04:09:28
法律状态公告日
法律状态信息
法律状态
2020-03-31
专利权人的姓名或者名称、地址的变更 IPC(主分类):G09B5/06 变更前: 变更后: 申请日:20170829
专利权人的姓名或者名称、地址的变更
2020-03-06
授权
授权
2018-01-30
实质审查的生效 IPC(主分类):G09B5/06 申请日:20170829
实质审查的生效
2018-01-05
公开
公开
技术领域
本发明涉及信息技术和教育技术领域,更具体地,涉及一种利用课件自动生成课堂教学知识图谱的系统和方法。
背景技术
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序。
RDF是一个处理元数据的XML(标准通用标记语言的子集)应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。也许这样解释元数据有些令人难以理解,举个简单的例子,书的内容是书的数据,而作者的名字、出版社的地址或版权信息就是书的元数据。数据和元数据的划分不是绝对的,有些数据既可以作为数据处理,也可以作为元数据处理,例如可以将作者的名字作为数据而不是元数据处理。
发明内容
本发明的目的在于克服现有技术的不足,提供一种利用课件自动生成课堂教学知识图谱的系统和方法,能够依据教师上课的课件,自动生成课堂教学内容相关的知识图谱。
为解决上述问题,本发明提供的技术方案是:一种利用课件自动生成课堂教学知识图谱的系统,其中,包括以下模块:
课堂内容记录模块,用于通过在用户电脑上安装的插件,记录识别课堂课件内容;
数据采集模块,与课堂内容记录模块连接,用于将记录的课堂课件内容转换为文本信息,并识别关键内容;
图谱生成模块,与数据采集模块连接,用于将数据采集模块识别的关键内容计算其权重值,建立相关属性-值对关系,存储数据生成预置知识图谱。
进一步地,所述的课堂内容记录模块包括:
课件识别单元,用于通过在用户电脑上安装的VSTO插件,记录课堂上课的课件内容以及页面切换时间,并将课件内容进行语义处理,识别关键知识内容;
视频流识别单元,与课件识别单元连接,用于通过在用户电脑上安装的VGA插件,记录电脑画面的变化,并记录时间值;
词频记录单元,用于根据时间值,同步课件和视频流的时间值,记录每个知识内容的时间属性,并记录词频。
进一步地,所述的数据采集模块包括:
语音转文本单元,与词频记录单元连接,用于将课堂教学过程的视频资源转换成音频文件,通过语音识别技术,转换成文本信息;
词频识别单元,与语音转文本单元连接,用于根据数据采集模块识别的关键知识内容,将关键知识内容作为关键词,通过TF-IDF算法,识别词频。
进一步地,所述的图谱生成模块包括:
权重值计算单元,与词频识别单元连接,用于根据时间时长和词频,对知识点进行权重值划分和加权平均值计算,生成父项知识内容和子项知识内容之间的权重值;
图谱生成单元,与权重值计算单元连接,用于根据权重值计算单元所计算的权重值,建立相关属性-值对关系,并将课堂内容记录模块、数据采集模块以及权重值计算单元所生成的数据,按照RDF数据格式进行存储,生成预置知识图谱。
本发明还提供一种用课件自动生成课堂教学知识图谱的方法,其中,包括以下步骤:
S1.对课堂内容进行记录,通过在用户电脑上安装的插件,记录识别课堂课件内容;
S2.数据采集,将记录的课堂课件内容转换为文本信息,并识别关键内容;
S3.图谱生成,将数据采集模块识别的关键内容计算其权重值,建立相关属性-值对关系,存储数据生成预置知识图谱。
进一步地,所述的S1步骤对课堂内容进行记录还包括:
S101.课件识别,通过在用户电脑上安装的VSTO插件,记录课堂上课的课件内容以及页面切换时间,并将课件内容进行语义处理,识别关键知识内容;
S102.视频流识别,通过在用户电脑上安装的VGA插件,记录电脑画面的变化,并记录时间值;
S103.词频记录,根据时间值,同步课件和视频流的时间值,记录每个知识内容的时间属性,并记录词频。
进一步地,所述的S2步骤数据采集还包括:
S201.语音转文本,将课堂教学过程的视频资源转换成音频文件,通过语音识别技术,转换成文本信息;
S202.词频识别,根据数据采集模块识别的关键知识内容,将关键知识内容作为关键词,通过TF-IDF算法,识别词频。
进一步地,所述的S3步骤图谱生成还包括:
S301.权重值计算,根据时间时长和词频,对知识点进行权重值划分和加权平均值计算,生成父项知识内容和子项知识内容之间的权重值;
S302.图谱生成,根据权重值计算单元所计算的权重值,建立相关属性-值对关系,并将课堂内容记录模块、数据采集模块以及权重值计算单元所生成的数据,按照RDF数据格式进行存储,生成预置知识图谱。
与现有技术相比,有益效果是:本发明提供的提供一种利用课件自动生成课堂教学知识图谱的系统和方法,能够依据教师上课的课件,依靠人工智能技术,识别课件内容,计算知识点的权重值,建立知识点之间的关系,自动生成课堂教学内容相关的知识图谱;可实时对教师教学知识内容进行评估,促进教师进行反思,不断提升教学质量。
附图说明
图1为本发明的整体结构示意图。
图2为本发明方法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
如图1所示,一种利用课件自动生成课堂教学知识图谱的系统,其中,包括以下模块:
课堂内容记录模块,用于通过在用户电脑上安装的插件,记录识别课堂课件内容;
数据采集模块,与课堂内容记录模块连接,用于将记录的课堂课件内容转换为文本信息,并识别关键内容;
图谱生成模块,与数据采集模块连接,用于将数据采集模块识别的关键内容计算其权重值,建立相关属性-值对关系,存储数据生成预置知识图谱。
在一些实施例中,课堂内容记录模块包括课件识别单元、视频流识别单元和词频记录单元;其中,课件识别单元,用于通过在用户电脑上安装的VSTO插件,记录课堂上课的课件内容以及页面切换时间,并将课件内容进行语义处理,识别关键知识内容;视频流识别单元,与课件识别单元连接,用于通过在用户电脑上安装的VGA插件,记录电脑画面的变化,并记录时间值;词频记录单元,用于根据时间值,同步课件和视频流的时间值,记录每个知识内容的时间属性,并记录词频。
在一些实施例中,数据采集模块包括语音转文本单元和词频识别单元,其中,语音转文本单元,与词频记录单元连接,用于将课堂教学过程的视频资源转换成音频文件,通过语音识别技术,转换成文本信息;词频识别单元,与语音转文本单元连接,用于根据数据采集模块识别的关键知识内容,将关键知识内容作为关键词,通过TF-IDF算法,识别词频。
在本发明中,需要注意的是,有些关键知识内容存在口语化的表述,需要利用正则表达式,进行模糊匹配,例如,“研究对象”,在实际授课时是“研究的对象”,则再处理时可设置成“研究?对象”来识别。
在一些实施例中,图谱生成模块包括权重值计算单元和图谱生成单元;其中,权重值计算单元,与词频识别单元连接,用于根据时间时长和词频,对知识点进行权重值划分和加权平均值计算,生成子项知识内容和二级子项知识内容之间的权重值;图谱生成单元,与权重值计算单元连接,用于根据权重值计算单元所计算的权重值,建立相关属性-值对关系,并将课堂内容记录模块、数据采集模块以及权重值计算单元所生成的数据,按照RDF数据格式进行存储,生成预置知识图谱。
在本发明中,由于知识图谱的知识内容是分级构成的,因此,每级的延伸概念要进行分级统计,例如:A有三个子项B1、B2、B3,这三个子项又有下一级的子项,分别是B1-1、B1-2、B1-3,B2-1、B2-2,B3-1、B3-2、B3-3,这8个二级子项的词频统计数和时长如下表:
表1词A的词频与时长
在计算权重关系时,B1-1对B1的权重为x*n1/(n1+n2+n3)+y*t1/(t1+t2+t3),其中x+y=1;B1对A的权重则为x*(n1+n2+n3)/(n1+n2+n3+……+n8)+y*(t1+t2+t3)/(t1+t2+t3+……+t8)。
如图2所示,本发明还提供一种用课件自动生成课堂教学知识图谱的方法,其中,包括以下步骤:
S1.对课堂内容进行记录,通过在用户电脑上安装的插件,记录识别课堂课件内容;
S2.数据采集,将记录的课堂课件内容转换为文本信息,并识别关键内容;
S3.图谱生成,将数据采集模块识别的关键内容计算其权重值,建立相关属性-值对关系,存储数据生成预置知识图谱。
具体地,S1步骤对课堂内容进行记录还包括:
S101.课件识别,通过在用户电脑上安装的VSTO插件,记录课堂上课的课件内容以及页面切换时间,并将课件内容进行语义处理,识别关键知识内容;
S102.视频流识别,通过在用户电脑上安装的VGA插件,记录电脑画面的变化,并记录时间值;
S103.词频记录,根据时间值,同步课件和视频流的时间值,记录每个知识内容的时间属性,并记录词频。
另外,S2步骤数据采集还包括:
S201.语音转文本,将课堂教学过程的视频资源转换成音频文件,通过语音识别技术,转换成文本信息;
S202.词频识别,根据数据采集模块识别的关键知识内容,将关键知识内容作为关键词,通过TF-IDF算法,识别词频。
其中,S3步骤图谱生成还包括:
S301.权重值计算,根据时间时长和词频,对知识点进行权重值划分和加权平均值计算,生成子项知识内容和二级子项知识内容之间的权重值;
S302.图谱生成,根据权重值计算单元所计算的权重值,建立相关属性-值对关系,并将课堂内容记录模块、数据采集模块以及权重值计算单元所生成的数据,按照RDF数据格式进行存储,生成预置知识图谱。
在本发明中,由于每个老师生成的知识图谱会存在差异,可预置标准的知识图谱,进行实际知识图谱的比对分析。或者,可将课堂教学评分最高的教师的知识图谱作为标准值,进行知识图谱之间的比对分析。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
机译: 一种利用移动映射系统自动生成路面类型的方法
机译: 一种废旧储油罐的一部分及其基础的再利用系统,以及促进这种再利用的方法;一种用于切割钢制储油罐底板的方法和一种以环保方式储油的系统。
机译: 一种利用互联网和地理信息系统或互联网地理信息系统显示房地产价格相关信息的方法,以及一种利用地理信息系统中的地图或土地注册图计算房地产价格并通过互联网主页进行显示的方法