公开/公告号CN112699633A
专利类型发明专利
公开/公告日2021-04-23
原文格式PDF
申请/专利权人 南京硕材信息科技有限公司;
申请/专利号CN202011637299.3
申请日2020-12-31
分类号G06F40/103(20200101);G06F40/205(20200101);
代理机构32252 南京钟山专利代理有限公司;
代理人徐博
地址 210000 江苏省南京市江宁区胜利路89号紫金研创中心4号楼903室
入库时间 2023-06-19 10:43:23
技术领域
本发明涉及计算机信息技术领域,具体的说是通用中小学教材格式标签及对应的解析方法。
背景技术
目前,中小学教材及相应的教学辅助书籍基本上还是采用纸质书籍,仅有少部分书籍实现了电子化,中小学教科书及相应的教学辅助材料的电子化、可视化(网页化)是必然的发展方向。电子化是指用电子介质展现教科书与教学辅助书籍的内容,可视化(网页化)是指用网页的形式通过浏览器展现教科书与教学辅助书籍的内容。实现电子化或可视化(网页化),最基础的工作就是用Web样式将教材教辅的内容容在Web环境下再现,这项工作当然可以用手工的方式完成,但是,这种方式显然不具有可操作性,工效太低;因此,最基础性的工作转化为教材教辅内容的形式化,即将中小学教科书和教学辅助书籍的内容从格式样式的角度抽象为一套形式化的体系(一般称为模板体系),将一本具体的教材或教辅数据的内容套用于特定的模板(或者说用模板样式描述一本具体的教材或教辅数据的内容),就得到了具体的电子化的教科书或教学辅助书籍。网站内容管理系统(CMS),就是利用标签系统实现了网页的抽象化,可以将这种技术扩大到中小学教科书与教学辅助书籍的电子化可视化领域。
发明内容
本发明要解决的技术问题是提供通用中小学教材格式标签及对应的解析方法,通过建设信息系统,将纸质的中小学教科书和教学辅助材料转化为电子化的书籍和可通过Web浏览器阅读的电子书籍,为教育信息化提供技术上的支撑。
为解决上述技术问题,本发明采用的技术方案为:
通用中小学教材格式标签及对应的解析方法,其特征在于:包括标签体系、书籍数据采集表单以及基于数据采集表解析标签单元;
所述的标签体系包括若干组标签,所述的标签用于描述教材教辅书籍的内容格式样式;
所述的书籍数据采集表单用于采集教材教辅书籍内容,并将书籍内容与标签对应;
所述的基于数据采集表解析标签单元用于将书籍数据采集表单中的内容套用对应标签后解析数据形成电子化内容;具体步骤如下:
步骤1,获取教材教辅书籍内容,分析书籍内容的格式样式是否已全部包含在系统中且有对应的标签;针对超出的格式样式设计对应的标签;
步骤2,按格式样式对应的标签,将书籍的内容填入数据采集表,填入过程标明内容与标签的对应关系;
步骤3,将书籍数据采集表内容进行合规性校验,对不合规内容进行修改;
步骤4,将书籍数据采集表单中的内容套用对应标签后解析数据形成电子化内容。
所述的标签体系中书页的解析流程如下:
步骤1,将模板页内容设为缓冲区并将结果集置为空;
步骤2,将指针0置为缓冲区起始位置;
步骤3,指针1定位于指针0后第一个标签起始位置;指针2定位于指针0后第一个标签终止位置+1;
步骤4,当指针1为空时,将指针0之后的内容写入结果集,输出结果集;
步骤5,当指针1不为空,且指针2不为空时,报告错误:标签不匹配;并将指针2移动至适当位置后执行步骤6;
当指针1不为空,且指针2为空时,执行步骤6;
步骤6,将指针0和指针1之间的内容写入结果集;
步骤7,解析标签,将实体写入结果集,并将指针0置于指针2的位置,重复步骤3至步骤7。
所述的标签体系中的标签包括但不限于循环标签、分支标签和元素标签。
所述的循环标签的解析流程具体如下:
步骤S1.1,将结果集置为空;
步骤S1.2,析出循环标签,析出循环结束标签,析出循环体置入缓冲区;
步骤S1.3,对循环标签进行正确性校验;当正确性校验不通过时,输出错误:循环标签不匹配;
步骤S1.4,当正确性校验通过后,按照列表顺序,解析循环体标签,将实体写入结果集,直至列表穷尽;
步骤S1.5,循环结束操作,输出结果集。
所述的分支标签的解析流程具体如下:
步骤S2.1,将结果集置为空;
步骤S2.2,析出分支标签,析出否则标签,析出分支结束标签;
步骤S2.3,对分支标签进行正确性校验;当正确性校验不通过时,输出错误:标签不匹配;
步骤S2.4,当正确性校验通过后,判定条件是否成立;
当判定条件成立时,将真分支体置入缓冲区;
当判定条件不成立时,else标签存在,将假分支体置入缓冲区;
步骤S2.5,解析分支体标签,将实体写入结果集;
步骤S2.6,分支结束操作,输出结果集。
所述的元素标签的解析流程具体如下:
步骤S3.1,从标签中析出元素属性,获得元素类型;
步骤S3.2,获得元素外部信息,基于外部信息获得数据库表;
步骤S3.3,当获得数据库表失败时,输出错误:标签不匹配;
步骤S3.4,当获得数据库表成功时,基于前述信息从数据库中读出适当的记录值;
步骤S3.5,当成功从数据库中读出适当的记录值时,将记录值写入结果集。
该种通用中小学教材格式标签及对应的解析方法能够达到的有益效果为:克服了传统教科书和教辅材料采用拍照片的方式实现电子化的缺陷,传统情况下一个书页基本上就是一幅照片或者主要的内容是一副照片,不可再加工再利用,从视觉效果上讲,保真度低。本方法针对中小学教科书与教学辅助书籍的实际,将其内容抽象,形成各种标签化的书籍;再建立解析标签单元解析这些标签,即基于具体的数据,解析对应的标签,形成电子化的书页和Web化的网页,从而实现纸质教科书和教学辅助书籍的电子化和可视化。进一步的,教师或学生以前可在纸质书上完成的操作可以通过增加对应标签直接完成。
附图说明
图1为本发明通用中小学教材格式标签及对应的解析方法中书页解析流程图。
图2为本发明通用中小学教材格式标签及对应的解析方法中循环标签解析流程图。
图3为本发明通用中小学教材格式标签及对应的解析方法中分支标签解析流程图。
图4为本发明通用中小学教材格式标签及对应的解析方法中元素标签解析流程图。
图5为本发明通用中小学教材格式标签及对应的解析方法中数据采样表样式示意图。
具体实施方式
以下结合说明书附图和具体优选的实施例对本发明作进一步描述。
通用中小学教材格式标签及对应的解析方法,其特征在于:包括标签体系、书籍数据采集表单以及基于数据采集表解析标签单元;
所述的标签体系包括若干组标签,所述的标签用于描述教材教辅书籍的内容格式样式;
所述的书籍数据采集表单用于采集教材教辅书籍内容,并将书籍内容与标签对应;
所述的基于数据采集表解析标签单元用于将书籍数据采集表单中的内容套用对应标签后解析数据形成电子化内容;具体步骤如下:
步骤1,获取教材教辅书籍内容,分析书籍内容的格式样式是否已全部包含在系统中且有对应的标签;针对超出的格式样式设计对应的标签;
步骤2,按格式样式对应的标签,将书籍的内容填入数据采集表,填入过程标明内容与标签的对应关系;
步骤3,将书籍数据采集表内容进行合规性校验,对不合规内容进行修改;
步骤4,将书籍数据采集表单中的内容套用对应标签后解析数据形成电子化内容。
本实施例中,如图1所示,标签体系中书页的解析流程如下:
步骤1,将模板页内容设为缓冲区并将结果集置为空;
步骤2,将指针0置为缓冲区起始位置;
步骤3,指针1定位于指针0后第一个标签起始位置;指针2定位于指针0后第一个标签终止位置+1;
步骤4,当指针1为空时,将指针0之后的内容写入结果集,输出结果集;
步骤5,当指针1不为空,且指针2不为空时,报告错误:标签不匹配;并将指针2移动至适当位置后执行步骤6;
当指针1不为空,且指针2为空时,执行步骤6;
步骤6,将指针0和指针1之间的内容写入结果集;
步骤7,解析标签,将实体写入结果集,并将指针0置于指针2的位置,重复步骤3至步骤7。
本实施例中,标签体系中的标签包括但不限于循环标签、分支标签和元素标签。
本实施例中,如图2所示,循环标签的解析流程具体如下:
步骤S1.1,将结果集置为空;
步骤S1.2,析出循环标签,析出循环结束标签,析出循环体置入缓冲区;
步骤S1.3,对循环标签进行正确性校验;当正确性校验不通过时,输出错误:循环标签不匹配;
步骤S1.4,当正确性校验通过后,按照列表顺序,解析循环体标签,将实体写入结果集,直至列表穷尽;
步骤S1.5,循环结束操作,输出结果集。
本实施例中,如图3所示,分支标签的解析流程具体如下:
步骤S2.1,将结果集置为空;
步骤S2.2,析出分支标签,析出否则标签,析出分支结束标签;
步骤S2.3,对分支标签进行正确性校验;当正确性校验不通过时,输出错误:标签不匹配;
步骤S2.4,当正确性校验通过后,判定条件是否成立;
当判定条件成立时,将真分支体置入缓冲区;
当判定条件不成立时,else标签存在,将假分支体置入缓冲区;
步骤S2.5,解析分支体标签,将实体写入结果集;
步骤S2.6,分支结束操作,输出结果集。
本实施例中,如图4所示,元素标签的解析流程具体如下:
步骤S3.1,从标签中析出元素属性,获得元素类型;
步骤S3.2,获得元素外部信息,基于外部信息获得数据库表;
步骤S3.3,当获得数据库表失败时,输出错误:标签不匹配;
步骤S3.4,当获得数据库表成功时,基于前述信息从数据库中读出适当的记录值;
步骤S3.5,当成功从数据库中读出适当的记录值时,将记录值写入结果集。
进一步的,常用标签表1所示:
表1
进一步的,常用的元素样式如表2所示:
表2
该方法解决了使用纸质书籍对应教学过程中多种活动中的许多不便,使用纸质书籍的教学过程数据无法采集,实用该种教材格式标签及对应的解析方法,可实现教学过程的电子化与信息化,从而使教学发展与教育改革在新的起点上继续前行。进一步的,书籍中文字和图片的关系多种多样,上述表2中简单罗列了常见的一些样式,已经是多达200种,加上其中的有重叠和叠加的情形,通过设计多种支持图文叠加的标签,和多种主从标签,可实现常见的图文叠加情形。
进一步的,通过该方法实现小学教科书和相应的教学辅助材料的电子化和可视化,再此基础上能够建起实时教学系统,即中小学教师可利用实时教学系统在课堂上实际地完成教学过程,可完成教材展现、概念讲解、例题演示、课堂提问、学生回答评价、课堂实时布置作业、检查学生完成课内作业情况、布置课后作业等等教学环节,为课堂教学信息化发展提供了技术支撑。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
机译: 用于记录具有图形功能的袖珍计算器的屏幕内容的设备,可将记录的数据直接转换为标签打印机可读的格式,以便将转换后的数据通过通用串行总线传输到标签打印机
机译: 用于在第一社交网络上部署多网络交互的计算机实现的方法;用于在社交网络平台上动态创建形式化组的计算机实现的方法;用于向社交网络平台的用户呈现多格式信息的计算机实现的方法;用于以通用标签的形式全局关联识别信号的计算机实现的方法;以及在社交网络平台上向用户投放广告的计算机部署方法
机译: 互联网广告中广告服务和信息跟踪的通用标签格式