技术领域
本申请涉及教学评价方法技术领域,尤其涉及一种教学质量评价方法、终端设备及计算机可读存储介质。
背景技术
随着时代的发展,社会对于科技创新的人才需求越来越大,高校教师作为本科教学的主要传授者,高校教师的教学质量的有效评估保障了高等教育的教学质量。教学质量评估是依据一定的评价体系,结合科学的评价方式,对教师在授课内容、能力、方法、学生表现、学习效果以及师生互动等多个指标做以分析。
课程质量分析的好坏,一方面需要全面的指标体系,另一方面需要科学的分析方式。作为信息技术的热点领域,机器学习及数据挖掘技术不断发展,推动了各行各业信息处理方式的转型。在高校的评教环节中,评教问卷是最重要的依据,包含大量有价值的信息,可以为教师改进自身的教学方式提供重要的参考。数据挖掘能够从已有的数据中,挖掘出隐含而且潜在的有用信息,这意味着数据挖掘可以挖掘教学质量的有关规律,进而对教师的教学质量做出全面的评价。
数据挖掘在目前的教学质量分析领域中已得到了尝试性应用。决策树的使用可以实现对教学质量的分类,但会依赖于已有的评教结果且分类较为单一;应用关联分析可以挖掘教学水平与年龄、职称以及学生平均成绩的关联性,但依然依赖于已有的评教结果,如果历史评教结果本身存在错误,这种逆推的研究就可能会出现偏差,多元线性回归分析亦是同理。
因此,一个全面、科学的教学质量评价模型对于教学理念的更新、教学短板的加强和教学业绩的评价具有重要意义。
发明内容
本申请实施例提供了一种教学质量评价方法、终端设备及计算机可读存储介质,相比于传统教学质量评价方法而言,该方法利用数据挖掘中聚类思想,并结合聚类中相似度的计算实现教师与标杆教师属性相似度对比、及教师与标杆教师的属性差异进而提出对应教师的教学优化方向。
第一方面,提供了一种教学质量评价方法,该方法包括:
获取包括多个教师的调查评价的问卷数据;
对所述问卷数据进行数据清洗及问卷量化,得到量化后的问卷数据;
对所述量化后的问卷数据进行聚类分析,得到最佳簇数及每个最佳簇的质心;
计算所述多个教师与所述每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名。
在一些实施例中,所述对所述问卷数据进行数据清洗及问卷量化的步骤包括:
将问卷条数小于第一阈值且评定为不达标的问卷数据筛除;
基于语义的函数依赖FD挖掘方法学习所述问卷数据中问题间的依赖关系,得到初始FD集合;
将所初始FD集合表达为贝叶斯网络模型得到初始网络,并基于语义分析对所述初始网络进行剪枝,得到最终FD集合;
根据所述最终FD集合计算数据置信度DC,并将所述数据置信度DC归一化,选取所述问卷数据中所有DC的最小值作为问卷置信度;
以所述问卷置信度为权重对所述问卷数据中各个设定指标下的选项总数进行累加,并进一步对所述问卷数据进行量化。
在一些实施例中,所述对所述量化后的问卷数据进行聚类分析的步骤包括:
对所述量化后的问卷数据进行归一化处理,以得到归一化后的问卷数据;
对所述归一化后的问卷数据进行特征降维和聚类分析,得到最佳簇数及每个最佳簇的质心。
在一些实施例中,所述对所述量化后的问卷数据进行归一化处理的步骤包括:
利用标杆教师的问卷数据,计算除所述标杆教师之外的教师与所述标杆教师之间的Jaccard相似度,以将所述量化后的问卷数据归一化至[0,1]区间。
在一些实施例中,所述对所述归一化后的问卷数据进行特征降维和聚类分析步骤包括:
S1、基于reliefF算法根据预设类别计算每个设定指标对预设类别的权值贡献,删除权值贡献小于第二阈值的设定指标,得到当前特征组合;
S2、为所述当前特征组合赋权,得到加权后的数据,基于相似度度量方法利用聚类模型对所述加权后的数据进行迭代聚类;
S3、计算当前迭代聚类的轮廓系数和精确度;
S4、在预设的迭代次数内循环执行步骤S1-S3直至迭代终止,并根据所得到的所有的所述轮廓系数和所有的所述精确度选取最优聚类模型、所述最优聚类模型的当前特征组合和所述最佳簇的质心,其中所述最优聚类模型为所述轮廓系数和所述精确度最大的聚类模型。
在一些实施例中,所述计算所述多个教师与所述每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名包括:
结合所述问卷置信度QC,计算所述多个教师与所述每个最佳簇的质心之间的曼哈顿距离,得到每个教师的总分数及总排名。
第二方面,提供了一种终端设备,所述终端设备可执行上述第一方面或第一方面的任意一种可选的实施方式中的方法。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元。该单元可以是软件和/或硬件。
第三方面,提供了一种终端设备,该终端设备包括:处理器以及和处理器相连的存储器;其中,该存储器包括计算机可读指令;该处理器用于执行该存储器中的计算机可读指令,从而使得该终端设备执行上述第一方面或第一方面的任意一种可选的实施方式中的方案。
第四方面,提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面的任意一种可选的实施方式中的方法。
第五方面,提供了一种芯片产品,执行上述第一方面或第一方面的任意一种可选的实施方式中的方法。
第六方面,提了供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面的任意一种可选的实施方式中的方法。
附图说明
图1是本申请实施例提供的一种教学质量评价方法的流程示意图。
图2是本申请实施例提供的另一种教学质量评价方法的流程示意图。
图3是本申请实施例提供的另一种教学质量评价方法的流程示意图。
图4是本申请实施例提供的另一种教学质量评价方法的流程示意图。
图5是本申请实施例提供的一种终端设备的结构示意图。
图6是本申请实施例提供的另一种终端设备的结构示意图。
具体实施方式
下面结合附图对本申请具体实施例作进一步的详细描述。
请参见图1,是本申请实施例提供的一种教学质量评价方法的流程示意图。如图1所示方法包括:
S101、终端设备获取包括多个教师的调查评价的问卷数据。
终端设备可设计教师教学质量评价问卷,采集学生填写后的问卷数据。其中(1)教师教学质量评价问卷设计:
(1a)根据结合专家经验及对象调研情况,设计六个“一级指标”,分别为“教学能力”、“教学方法”、“教学内容”、“师生互动”、“学生表现”以及“学习效果”。
(1b)每个“一级指标”下,分别有着更为细化的三个“二级指标”,这些“二级指标”构成了调查问卷的问题内容,共18个,每个“二级指标”对应5个选项。
(1c)每个问题设置5个选项,用1-5来表示。
(1d)每门课程用bsid作为唯一标识,对同一门课多位教师共同上课的情况采用bsid与教职工号码结合的方式进行区分。
(1e)为每位参与评教的学生分配不同问题,每个问题下至少应包含8条有效回答。
S102、终端设备对所述问卷数据进行数据清洗及问卷量化,得到量化后的问卷数据。
在一个示例中,对于问卷条数过少(例如小于第一阈值)、一级指标下的评教人数小于所设阈值、或被教务处评定为不达标的问卷数据进行初步筛除。请参见图2是本申请实施例提供的S102的具体细化的流程示意图。如图2所示方法包括:
S110、利用基于语义的函数依赖(Functional Dependence,FD)挖掘方法学习问卷问题间的依赖关系,得到初始FD集合;
S120、将FD集合表述为贝叶斯网络模型得到初始网络
S130、基于数据语义分析对网络进行剪枝,得到筛选后的最终FD集合;
S140、根据最终FD集合计算数据置信度DC;
在一个示例中,假设问卷数据中问题之间存在函数依赖关系A=f(B),样本t中,属性A,B的取值记为a,b且变量a在证据b取值确定的情况下,采用如下公式计算数据置信度DC:
采用如下公式,将数据置信度DC归一化至[0,1]:
S150、根据得到的DC计算问卷置信度QC;
将问卷置信度QC定义为当前问卷所有DC的最小值,公式为:
其中,I表示数据库中|I|个元组组成的实例(即问卷样本总集),
S160、以QC为权重对各个二级指标下的选项总数累加,对教师问卷进行量化。
S103、终端设备对量化后的问卷数据进行聚类,得到最佳簇数及每个最佳簇的质心。
S104、计算多个教师与每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名。
在一个示例中,终端设备对量化后的问卷数据进行归一化处理,得到归一化后的问卷数据;利用归一化后的问卷数据进行特征降维和聚类,得到最佳簇数及每个最佳簇的质心。具体的,这里可确定标杆教师,结合标杆教师的问卷数据及相似度计算进行评价指标量化。具体请参见图3所示方法包括:
S210、选定教学评价为绝对优秀的教师作为标杆教师。
本申请中标杆教师应涵盖所有学科类型,以不同学科类型的课程数占总课程数的比例确定各学科标杆教师人数,标杆教师每学年按照固定比例,原则进行保留与更新。
S220、统计标杆教师问卷选项分布;
本申请中统计标杆教师各二级指标下的五个选线出现频数,得到分布;将标杆教师各二级指标的分布作为标杆教师样本集。
S230、统计其他教师问卷选项分布;
本申请中统计其他教师各二级指标下的五个选项出现频数,得到分布;将其他教师各二级指标的分布作为其他教师样本集。
S240、计算各二级指标下其他教师分布与标杆教师分布的Jaccard系数;
S250:根据Jaccard系数进行加权量化。
在一个示例中,利用归一化后的问卷数据进行特征降维和聚类,其具体包括如图4所示方法的流程步骤:
S310、使用ReliefF算法进行特征降维,得到当前特征组合;
本申请中根据其他教师与标杆教师之间的Jaccard相似度,计算教师每个指标下的平均得分,作为训练样本的集合D。设有对象抽样次数m、近邻对象数k、迭代次数为N、权值阈值为δ、随机抽样样本为R、与R同类的近邻对象记为H、与R不同类的近邻对象记为M、特征为A,则若R和H中样本在特征A上的相似度小于R和M中样本在特征A上的相似度,则说明当前特征对于样本类别的区分是有益的,对应增加特征A的权值,相反,当前特征对于样本类别的区分起反作用,对应降低特征A的权值。
其中特征A权值计算公式为:
式中H
初始化权值为0,随机选取一个样本R,寻找K个与R同类的近邻样本H,同时寻找K个与R不同类的近邻样本M,按照上述公式计算特征权值,重复N次,计算各个指标的平均权值。其中指标的权值越大,表明当前指标对类别的分辨能力越强,反之,表示当前指标对类别的分辨能力越弱;在每个一级指标中,删除对应一级指标下权值贡献小于设定阈值的二级指标。
S320、为当前特征组合赋权,获得加权后的数据;
S330、确定相似度度量方法,对加权后的数据进行迭代聚类;
本申请通过对最佳簇数的实验讨论确定最佳簇数为4,取整个数据集中每个指标特征的最大值,组成质心向量作为初始质心,计算公式为:
center=(max(x)-min(x))×p+min(x)
其中,x代表输入数据全体,p值的经验定义由多次迭代的聚类结果决定,使得模型能够快速收敛如下表所示:
表1初始质心计算公式中参数p的经验值
利用曼哈顿距离公式,结合问卷置信度QC计算数据集中每个样本与质心的相似度并排序:
S340、根据轮廓系数、精确度等参数判定聚类质量;
本申请设样本o的轮廓系数为S(o),计算公式如下:
其中a(o)表示对象o与同一簇内其它对象之间的平均相似度,b(o)表示对象o与不属于o的所有簇的最小平均相似度。记录当前特征组合下的轮廓系数,特别地在预设的迭代次数内循环执行S310-S340的操作,直至迭代终止。
S350、选择聚类质量最高的聚类模型、对应的当前特征组合及最佳簇的质心。
本申请将所得轮廓系数的序列进行排序,得到轮廓系数最大的迭代位置;以轮廓系数最大的聚类模型作为最终模型,此模型对应的特征空间作为最终特征空间,并对当前特赋值。
综上所述,本发明公开一种基于数据挖掘的教师教学质量评价模型,主要解决目前以调查问卷为主的教学质量评价方法在具体场景适应性、评价水平区分度和教师学习支持方面存在明显不足的问题。该方法基于ReliefF算法对样本进行训练,通过计算每个评教指标的对应权重对指标特征进行赋权,避免了传统的人为指定赋值法带来的主观性与片面性;利用数据挖掘中的聚类分析思想,实现了对教师教学质量的类别区分,分为A档、B档、C档、D档,其中A代表教学水平优秀、B代表教学水平良好、C代表教学水平中等、D代表教学水平较差,方便教师了解自己的教学水平;为教师提供自身在教学能力、教学方法、教学内容、师生互动、学生表现以及学习效果六个一级指标量化的得分,还可将计算后的各簇质心以雷达图和表格的形式展现,方便教师查看自己总得分及各类指标下量化得分,进而为教师提供定制化多方面的教学行为量化评估。
请参见图5,是本申请实施例提供的一种终端设备的结构示意图,如图5所示的终端设备中包括获取单元501、处理单元502、聚类单元503及计算单元504。其中,
获取单元501用于获取包括多个教师的调查评价的问卷数据;
处理单元502用于对所述问卷数据进行数据清洗及问卷量化,得到量化后的问卷数据;
聚类单元503用于对所述量化后的问卷数据进行聚类分析,得到最佳簇数及每个最佳簇的质心;
计算单元504用于计算所述多个教师与所述每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名。
在一些实施例中,处理单元502具体用于:
将问卷条数小于第一阈值且评定为不达标的问卷筛除;
基于语义的函数依赖FD挖掘方法学习所述问卷数据中问题间的依赖关系,得到初始FD集合;
将所初始FD集合表达为贝叶斯网络模型得到初始网络,并基于语义分析对所述初始网络进行剪枝,得到最终FD集合;
根据所述最终FD集合计算数据置信度DC,并将所述数据置信度DC归一化,选取所述问卷数据中所有DC的最小值作为问卷置信度;
以所述问卷置信度为权重对所述问卷数据中各个设定指标下的选项总数进行累加,并进一步对所述问卷数据进行量化。
在一些实施例中,聚类单元503具体用于对所述量化后的问卷数据进行归一化处理,以得到归一化后的问卷数据;
对所述归一化后的问卷数据进行特征降维和聚类分析,得到最佳簇数及每个最佳簇的质心。
在一些实施例中,聚类单元504具体用于利用标杆教师的问卷数据,计算除所述标杆教师之外的教师与所述标杆教师之间的Jaccard相似度,以将所述量化后的问卷数据归一化至[0,1]区间。
在一些实施例中,聚类单元504具体用于执行如下步骤:
S1、基于reliefF算法根据预设类别计算每个设定指标对预设类别的权值贡献,删除权值贡献小于第二阈值的设定指标,得到当前特征组合;
S2、为所述当前特征组合赋权,得到加权后的数据,基于相似度度量方法利用聚类模型对所述加权后的数据进行迭代聚类;
S3、计算当前迭代聚类的轮廓系数和精确度;
S4、在预设的迭代次数内循环执行步骤S1-S3直至迭代终止,并根据所得到的所有的所述轮廓系数和所有的所述精确度选取最优聚类模型、所述最优聚类模型的当前特征组合和所述最佳簇的质心;其中所述最优聚类模型为所述轮廓系数和所述精确度最大的聚类模型。
在一些实施例中,计算单元505用于结合所述问卷置信度QC,计算所述多个教师与所述每个最佳簇的质心之间的曼哈顿距离,得到每个教师的总分数及总排名。
请参见图6,是本申请实施例提供的另一种终端设备的结构示意图。如图6所示的终端设备600包括:至少一个输入设备601;至少一个输出设备602;至少一个微控制单元603(也可称为处理器603),例如CPU;和存储器604,上述输入设备601、输出设备602、处理器603和存储器604通过总线605连接。
其中,上述输入设备601具体可为移动终端的触控面板,包括触摸屏和触控屏,用于检测终端触控面板上的操作指令。
上述输出设备602具体可为移动终端的显示屏,用于输出、显示信息。
上述存储器604可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。上述存储器604用于存储一组程序代码,上述输入设备601、输出设备602和处理器603用于调用存储器604中存储的程序代码执行相应操作,其中处理器603具体用于执行如下操作:
获取包括多个教师的调查评价的问卷数据;
对所述问卷数据进行数据清洗及问卷量化,得到量化后的问卷数据;
对所述量化后的问卷数据进行聚类分析,得到最佳簇数及每个最佳簇的质心;
计算所述多个教师与所述每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名。
在一些实施例中,所述对所述问卷数据进行数据清洗及问卷量化的步骤包括:
将问卷条数小于第一阈值且评定为不达标的问卷筛除;
基于语义的函数依赖FD挖掘方法学习所述问卷数据中问题间的依赖关系,得到初始FD集合;
将所初始FD集合表达为贝叶斯网络模型得到初始网络,并基于语义分析对所述初始网络进行剪枝,得到最终FD集合;
根据所述最终FD集合计算数据置信度DC,并将所述数据置信度DC归一化,选取所述问卷数据中所有DC的最小值作为问卷置信度;
以所述问卷置信度为权重对所述问卷数据中各个设定指标下的选项总数进行累加,并进一步对所述问卷数据进行量化。
在一些实施例中,所述对所述量化后的问卷数据进行聚类分析的步骤包括:
对所述量化后的问卷数据进行归一化处理,以得到归一化后的问卷数据;
对所述归一化后的问卷数据进行特征降维和聚类分析,得到最佳簇数及每个最佳簇的质心。
在一些实施例中,所述所述对所述量化后的问卷数据进行归一化处理的步骤包括:
利用标杆教师的问卷数据,计算除所述标杆教师之外的教师与所述标杆教师之间的Jaccard相似度,以将所述量化后的问卷数据归一化至[0,1]区间。
在一些实施例中,所述对所述归一化后的问卷数据进行特征降维和聚类分析步骤包括:
S1、基于reliefF算法根据预设类别计算每个设定指标对预设类别的权值贡献,删除权值贡献小于第二阈值的设定指标,得到当前特征组合;
S2、为所述当前特征组合赋权,得到加权后的数据,基于相似度度量方法利用聚类模型对所述加权后的数据进行迭代聚类;
S3、计算当前迭代聚类的轮廓系数和精确度;
S4、在预设的迭代次数内循环执行步骤S1-S3直至迭代终止,并根据所得到的所有的所述轮廓系数和所有的所述精确度选取最优聚类模型、所述最优聚类模型的当前特征组合和所述最佳簇的质心;其中所述最优聚类模型为所述轮廓系数和所述精确度最大的聚类模型。
在一些实施例中,所述计算所述多个教师与所述每个最佳簇的质心之间的相似度距离,得到每个教师的总分数及总排名包括:
结合所述问卷置信度QC,计算所述多个教师与所述每个最佳簇的质心之间的曼哈顿距离,得到每个教师的总分数及总排名。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
机译: 识别方法,终端设备和计算机可读存储介质{身份认证方法,终端设备和计算机可读存储介质}
机译: 非临时性计算机可读存储介质,其存储用于终端设备的计算机可读指令,终端设备和用于终端设备的方法
机译: 非易失性计算机可读存储介质,用于存储终端设备的计算机可读指令,终端设备以及终端设备的方法