首页> 中国专利> 一种应用于K12教育的学生错题及个性化变试题的算法

一种应用于K12教育的学生错题及个性化变试题的算法

摘要

本发明公开了一种应用于K12教育的学生错题及个性化变试题的算法。本发明中,通过教育行业专业知识+技术手段+智能推荐算法+精准标签方式优化和升级算法实现,提高K12阶段学生个性化错题本及变试题推送的精准度,提高学校教学质量和让学生少做题、做好题,让教育回归本质,及时、减负、精准、增效;通过标签的设置,学校的基础数据更加完善,为后续的的推送做基础支撑;知识点矫正人工干后,将数据做了清洗和抽取,提高了数据的准确性;将清洗和抽取的数据做了试题数据画像结合推荐算法做到了千人千面;推荐算法的步骤设置结合行业特性做精准个性推荐,错题集变试题应用在学生、老师场景,可以下载和在线查看,方便快捷。

著录项

  • 公开/公告号CN113806348A

    专利类型发明专利

  • 公开/公告日2021-12-17

    原文格式PDF

  • 申请/专利权人 四川云数赋智教育科技有限公司;

    申请/专利号CN202111124925.3

  • 发明设计人 左凌慧;梁利阳;李江;

    申请日2021-09-25

  • 分类号G06F16/215(20190101);G06F16/2458(20190101);G06Q50/20(20120101);

  • 代理机构11616 北京喆翙知识产权代理有限公司;

  • 代理人黄玉清

  • 地址 610000 四川省成都市高新区天华二路219号11栋19层19001-1

  • 入库时间 2023-06-19 13:45:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-17

    发明专利申请公布后的撤回 IPC(主分类):G06F16/215 专利申请号:2021111249253 申请公布日:20211217

    发明专利申请公布后的撤回

说明书

技术领域

本发明属于K12教育技术领域,具体为一种应用于K12教育的学生错题及个性化变试题的算法。

背景技术

在K12教育领域,学生考试结束后,每个学生的错题根据成绩得分已经很明确了。目前市面上的学业采集系统都能做到学生错题集导出功能,但是技术分析和推荐的结果,学校老师、家长、学生反馈效果和质量很差,满足不了根据学生错题个性化推荐相关变试题的个性化需求。

市面上的技术体系清一色是通过学生错题的知识点、学科加上一些基础的推荐算法做对应的错题分析及变试题推送,这些分析方式受地区、学段、学校所属的层级、考试的难易度、考区等制约,做不到精准和个性推荐。基于以上原因,本发明方案通过行业知识+技术手段+智能推荐算法+精准标签方式优化和升级算法实现。

发明内容

本发明的目的在于:为了解决上述提出的问题,提供一种应用于K12教育的学生错题及个性化变试题的算法。

本发明采用的技术方案如下:一种应用于K12教育的学生错题及个性化变试题的算法,所述应用于K12教育领域学生错题及个性化变试题推荐的算法实现包括以下步骤:

S1:进行学校基础标签信息的设置:

学校基础信息进入系统后,对学校学段需要标注对应的标签,标签设置如下:小学:小升初所属卷区(本区,本市,本省,其他)、年制(五年、六年);初中:中考所属卷区(本区,本市,本省,其他);高中:高考所属卷区(全国I卷,全国II卷,全国III卷,省/自治区自主命题);

S2:学校在各个区域所属层级标签设置:小学:A、B、C、D(本区,本市,本省,全国分别标注);初中:A、B、C、D(本区,本市,本省,全国分别标注);高中:A、B、C、D(本区,本市,本省,全国分别标注);

S3:试题标签设置:学校考试结束后,将学校给的试题和答案解析在应用系统进行标注,标注的内容包括:试题内容、标准答案、试题解析、试题对应的3级知识点(一线教师标注,多个知识点需要设置每个知识点的优先级别),同时,将试题内容文字提取结合题目图片中文字的OCR识别,提取数学符号、文字并存储;

S4:试题难度(得分率)标注:

考试阅卷结束后,将应用系统智能生成的年级得分率、班级得分率、个人得分情况智能化标注成对应难度值(表示试卷的难易程度,值介于0-1之间,值越大表示试题越简单,难度在0.7-0.8间有利于反应学生真实水平,难度小于0.4属于偏难无法有效区分学生水平)

S5:人工辅助标注:

对于在应用系统人工标注的3级知识点,学校的学科组长可以根据学校、年级考试的实际情况做对应知识点的矫正,矫正的结果作为最终的知识点纳入系统判断和推送范畴

S6:数据存储和试题画像:

(1)数据清洗:

将第一阶段获取的标签数据存储在非关系型数据库(NoSQL)中,对于应用系统中的标签数据进行预处理、分类处理。预处理维度包括:缺失数据处理、数据的标准化;分类处理包括:学校、试题、学科、学年、知识点、学区等的数据分类及数据抽取管理

S7:有效数据抽取:

将数据清洗后的结果进行抽取并存储,移除非有效数据,比如:语文的作文、英语的作文(每个学生得到满分的几率很小,这部分数据在学生错题中作为无效数据排除)。抽取采用批处理(本系统采用Hadoop做离线数据抽取)非实时计算技术框架实现,抽取的数据存储在Hive中,方便实时读取

S8:异步试题画像:

当一场考试结束且试题录入知识点矫正完成后,应用系统批处理脚本自动运行并处理数据,处理的数据包括:根据得分率(A%)生成学生的错题数据;根据错题情况结合推荐算法智能推荐出个性化变试题数据。试题画像做到千人千面

S9:错题计算算法:

根据标注的得分率B%(系统默认为A%,得分率A%以下标记为错题),系统根据试题学科提示用户是否移除语文和英语的作文(系统默认是移除选项);

S10:变试题推荐算法:每到错题给学生推荐2道变试题,一道“错题巩固”,一道“能力拓展”,第一道是难度系数差不多的同等级别的错题,第二道题是难度系数大一点的拓展题,具体的推荐逻辑如下:

S11:锁定考区、学校、学段、年级的tag标签属性,此标签是变试题的基础范围属性;根据考试确定学科、试题、试题的知识点、本考生每道题的得分标签数据;推荐的变试题需要根据策略排除本校的数据。

在一优选的实施方式中,所述步骤S9中主观题根据老师打分和试题总分计算的得分率做校验,客观题系统自动识别正确与否并计算得分率后做校验。最后将满足条件的主观题和客观题汇总成学生错题。

在一优选的实施方式中,所述步骤S11中根据试题确定是否是语文、英语,如果是的话需要根据配置确定是否对作文标记移除。

在一优选的实施方式中,所述步骤S11中校验考试年级是否是毕业班年级(五六年级、初三、高三),毕业班可以推荐本学段其他年级的错题。

在一优选的实施方式中,所述步骤S11中,缩小能推荐的试题范围之后,“错题巩固”这道题需要查找和本试题得分率误差在10%之内的题作为变试题,同时满足本错题和题库中数学符号、文字匹配最高的作为此变试。

在一优选的实施方式中,所述步骤S11中,能力拓展”这道题需要查找得分率大于本试题得分率20%之的题作为变试题,同时满足本错题和题库中数学符号、文字匹配最高的作为此变试题。

在一优选的实施方式中,所述步骤S11中,变试题临界条件:考虑变试题需要强大的学校用户基数做支持,当按照如上均未有满足条件的试题出现时,系统宁缺毋滥。

在一优选的实施方式中,所述步骤S11中,在系统的学生端、老师端应用场景中,根据设置的不同得分率,个性化推荐出学生错题本及变试题。试题可以以word、pdf的格式下载和在线查。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1、本发明中,通过标签的设置,学校的基础数据更加完善,为后续的的推送做基础支撑;知识点矫正人工干后,将数据做了清洗和抽取,提高了数据的准确性;将清洗和抽取的数据做了试题数据画像结合推荐算法做到了千人千面。

2、本发明中,推荐算法的步骤设置结合行业特性做精准个性推荐,结果数据宁缺毋滥;错题集变试题应用在学生、老师场景,可以下载和在线查看,方便快捷。

附图说明

图1为本发明的整体应用场景图;

图2为本发明中学生使用场景图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1-2,

实施例一:

应用于K12教育领域学生错题及个性化变试题推荐的算法实现包括以下步骤:

S1:标签设置

(1)学校基础标签信息:

学校基础信息进入系统后,对学校学段需要标注对应的标签,标签设置如下:

小学:小升初所属卷区(本区,本市,本省,其他)、年制(五年、六年)

初中:中考所属卷区(本区,本市,本省,其他)

高中:高考所属卷区(全国I卷,全国II卷,全国III卷,省/自治区自主命题)

(2)学校在各个区域所属层级标签设置:

小学:A、B、C、D(本区,本市,本省,全国分别标注)

初中:A、B、C、D(本区,本市,本省,全国分别标注)

高中:A、B、C、D(本区,本市,本省,全国分别标注)

备注:A到D 4个层级,A表示第一梯队、B表示第二梯队、C表示第三梯队、D表示第四梯队,学校所属的梯队根据教育部评定的学校属性决定(如:国家级示范性普通高中、四川省一级示范性普通高中、四川省重点中学、其他)。

(3)试题标签设置:

学校考试结束后,将学校给的试题和答案解析在应用系统进行标注,标注的内容包括:试题内容、标准答案、试题解析、试题对应的3级知识点(一线教师标注,多个知识点需要设置每个知识点的优先级别),同时,将试题内容文字提取结合题目图片中文字的OCR识别,提取数学符号、文字并存储。

(4)试题难度(得分率)标注:

考试阅卷结束后,将应用系统智能生成的年级得分率、班级得分率、个人得分情况智能化标注成对应难度值(表示试卷的难易程度,值介于0-1之间,值越大表示试题越简单,难度在0.7-0.8间有利于反应学生真实水平,难度小于0.4属于偏难无法有效区分学生水平)。

(5)人工辅助标注:

对于在应用系统人工标注的3级知识点,学校的学科组长可以根据学校、年级考试的实际情况做对应知识点的矫正,矫正的结果作为最终的知识点纳入系统判断和推送范畴。

S2:数据存储和试题画像:

(1)数据清洗:

将第一阶段获取的标签数据存储在非关系型数据库(NoSQL)中,对于应用系统中的标签数据进行预处理、分类处理。预处理维度包括:缺失数据处理、数据的标准化;分类处理包括:学校、试题、学科、学年、知识点、学区等的数据分类及数据抽取管理。

(2)有效数据抽取:

将数据清洗后的结果进行抽取并存储,移除非有效数据,比如:语文的作文、英语的作文(每个学生得到满分的几率很小,这部分数据在学生错题中作为无效数据排除)。抽取采用批处理(本系统采用Hadoop做离线数据抽取)非实时计算技术框架实现,抽取的数据存储在Hive中,方便实时读取。

(3)异步试题画像:

当一场考试结束且试题录入知识点矫正完成后,应用系统批处理脚本自动运行并处理数据,处理的数据包括:根据得分率(A%)生成学生的错题数据;根据错题情况结合推荐算法智能推荐出个性化变试题数据。试题画像做到千人千面。

错题计算算法:

根据标注的得分率B%(系统默认为A%,得分率A%以下标记为错题),系统根据试题学科提示用户是否移除语文和英语的作文(系统默认是移除选项),主观题根据老师打分和试题总分计算的得分率做校验,客观题系统自动识别正确与否并计算得分率后做校验。最后将满足条件的主观题和客观题汇总成学生错题集。

变试题推荐算法:

每到错题给学生推荐2道变试题,一道“错题巩固”,一道“能力拓展”,第一道是难度系数差不多的同等级别的错题,第二道题是难度系数大一点的拓展题,具体的推荐逻辑如下:

锁定考区、学校、学段、年级的tag标签属性,此标签是变试题的基础范围属性;

根据考试确定学科、试题、试题的知识点、本考生每道题的得分标签数据;

根据试题确定是否是语文、英语,如果是的话需要根据配置确定是否对作文标记移除;

校验考试年级是否是毕业班年级(五六年级、初三、高三),毕业班可以推荐本学段其他年级的错题;

推荐的变试题需要根据策略排除本校的数据;

缩小能推荐的试题范围之后,“错题巩固”这道题需要查找和本试题得分率误差在10%之内的题作为变试题,同时满足本错题和题库中数学符号、文字匹配最高的作为此变试题。

“能力拓展”这道题需要查找得分率大于本试题得分率20%之的题作为变试题,同时满足本错题和题库中数学符号、文字匹配最高的作为此变试题。

变试题临界条件:考虑变试题需要强大的学校用户基数做支持,当按照如上(6)、(7)均未有满足条件的试题出现时,系统宁缺毋滥。

S3推送实现:

在系统的学生端、老师端应用场景中,根据设置的不同得分率,个性化推荐出学生错题本及变试题。试题可以以word、pdf的格式下载和在线查看。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号