首页> 中国专利> 一种基于职业能力大数据的专业建设及学生成长分析方法及系统

一种基于职业能力大数据的专业建设及学生成长分析方法及系统

摘要

本发明提供一种基于职业能力大数据的专业建设及学生成长分析方法及系统,包括获取学校学生的历史就业情况,对岗位要求提取关键词并对关键词进行扩展;对岗位要求进行语义分析,并将语义近似的岗位进行聚类;将第二聚类正样本简历中的技能取交集,将第二聚类负样本简历中的技能取并集,求所述第一交集与所述第一并集的差集为相应岗位的重点技能;对第三聚类正样本的每一门专业课求平均分,对所述第三聚类负样本的每一门专业课求平均分,比较第三聚类正样本的每一门专业课求平均分与第三聚类负样本的每一门专业课求平均分,其中差异最大的专业课为相应岗位的重点专业课程。本发明通过分析学生的简历信息,得到用人单位真实意图,为专业建设及学生成长提供专业的指导。

著录项

  • 公开/公告号CN114897646A

    专利类型发明专利

  • 公开/公告日2022-08-12

    原文格式PDF

  • 申请/专利权人 重庆云华科技有限公司;

    申请/专利号CN202210393793.2

  • 申请日2022-04-15

  • 分类号G06Q50/20(2012.01);G06F16/906(2019.01);

  • 代理机构成都坤伦厚朴专利代理事务所(普通合伙) 51247;

  • 代理人杨敬禹

  • 地址 400039 重庆市九龙坡区火炬大道69号重庆启迪科技园13号楼201室

  • 入库时间 2023-06-19 16:20:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-30

    实质审查的生效 IPC(主分类):G06Q50/20 专利申请号:2022103937932 申请日:20220415

    实质审查的生效

说明书

技术领域

本发明属于植物景观屋面领域,具体涉及种植景观屋面阻根防水系统在结构上的改进。

背景技术

随着时代的高速发展,绿色、节能、环保愈来愈成为人们对生活品质的追求,而新型建筑节能园林式种植景观屋面对减少热岛效应、净化空气、降解空中浮尘、营造和谐社会都有良好的效果,同时也是非常好看的空中景观,然而目前的种植景观屋面常采用卷材的形式来阻根防水,长期使用难以抵挡植物根系的穿刺,导致失去防水作用。

发明内容

为了解决上述问题,本发明提出了一种基于职业能力大数据的专业建设及学生成长分析方法及平台,综合学校历史就业情况,由于简历代表了学生的职业能力,因此通过分析学生的简历信息,得到用人单位真实意图,为专业建设及学生成长提供专业的指导。

根据本发明的一个方面,提供一种基于职业能力大数据的专业建设及学生成长分析方法,其特征在于包括如下步骤:获取学校学生的历史就业情况,包括用人单位的招聘岗位信息、通过以及没有通过相应岗位简历筛选的简历详情;对岗位要求提取关键词并对关键词进行扩展;对关键词扩展后的岗位要求进行语义分析,并将语义近似的岗位进行聚类,得到第一聚类;对所述第一聚类中的专业课成绩相近的简历进行聚类,得到第二聚类,取所述第二聚类中通过简历筛选的简历为第二聚类正样本,取所述第二聚类中没有通过简历筛选的简历为第二聚类负样本,将所述第二聚类正样本简历中的技能取交集,得到第一交集,将所述第二聚类负样本简历中的技能取并集,得到第一并集,求所述第一交集与所述第一并集的差集,得到第一差集,所述第一差集为相应岗位的重点技能;对所述第一聚类中的简历的技能提取关键词,并进行技能相近的简历聚类,得到第三聚类,取所述第三聚类中通过简历筛选的简历为第三聚类正样本,取第三聚类中没有通过简历筛选的简历为第三聚类负样本,对所述第三聚类正样本的每一门专业课求平均分,对所述第三聚类负样本的每一门专业课求平均分,比较第三聚类正样本的每一门专业课求平均分与第三聚类负样本的每一门专业课求平均分,其中差异最大的专业课为相应岗位的重点专业课程。

优先地,还可包括根据所述相应岗位的重点专业课程进行专业建设,具体包括如下一种或多种方法:提示提高相应专业课程的学分、提示提高相应专业课程的学时。

优先地,还可包括根据所述相应岗位的重点技能进行学生成长分析,具体为:分析学生简历,如果目标岗位缺少相应技能,则提示学生学习相应的技能。

根据本发明的一个方面,提供一种基于职业能力大数据的专业建设及学生成长分析系统,其特征在于包括如下模块:获取模块,用于获取学校学生的历史就业情况,包括用人单位的招聘岗位信息、通过以及没有通过相应岗位简历筛选的简历详情;扩展模块,用于对岗位要求提取关键词并对关键词进行扩展;聚类模块,用于对关键词扩展后的岗位要求进行语义分析,并将语义近似的岗位进行聚类,得到第一聚类;第一分析模块,用于对所述第一聚类中的专业课成绩相近的简历进行聚类,得到第二聚类,取所述第二聚类中通过简历筛选的简历为第二聚类正样本,取所述第二聚类中没有通过简历筛选的简历为第二聚类负样本,将所述第二聚类正样本简历中的技能取交集,得到第一交集,将所述第二聚类负样本简历中的技能取并集,得到第一并集,求所述第一交集与所述第一并集的差集,得到第一差集,所述第一差集为相应岗位的重点技能;第二分析模块,用于对所述第一聚类中的简历的技能提取关键词,并进行技能相近的简历聚类,得到第三聚类,取所述第三聚类中通过简历筛选的简历为第三聚类正样本,取第三聚类中没有通过简历筛选的简历为第三聚类负样本,对所述第三聚类正样本的每一门专业课求平均分,对所述第三聚类负样本的每一门专业课求平均分,比较第三聚类正样本的每一门专业课求平均分与第三聚类负样本的每一门专业课求平均分,其中差异最大的专业课为相应岗位看重专业课程。

优选地,还包括:第一提示模块,用于根据所述相应岗位的重点专业课程进行专业建设,具体包括如下一种或多种方法:提示提高相应专业课程的学分、提示提高相应专业课程的学时。

优选地,还包括:第二提示模块,用于根据所述相应岗位的重点技能进行学生成长分析,具体为:分析学生简历,如果目标岗位缺少相应技能,则提示学生学习相应的技能。

在本发明提供的技术方案中,通过分析就业数据中的简历筛选情况,通过聚类的方法,屏蔽相同的条件,突出种简历中专业课、技能的差异,将相应岗位的重点专业课、技能分析出来,从而指导学习的专业建议和学生的成长分析。

附图说明

图1,为本发明方法的流程图;

图2,为本发明的系统框架图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

如图1所示,一方面本申请公开了一种基于职业能力大数据的专业建设及学生成长分析方法,具体包括:

S1,获取学校学生的历史就业情况,包括用人单位的招聘岗位信息、通过以及没有通过相应岗位简历筛选的简历详情。

由于面试及笔试的成绩受学生的个人能力影响极大,最终录取结果较难分析,而简历代表了学生的职业能力,只要简历通过筛选即说明相应的学生有用人单位的重点地方,这里的看重是指用人单位认为该岗位真正需要的专业知识或个人技能,一般是学习成绩或者其中一些个人技能,只有部分学科的成绩达到一种程度和/或有部分特征技能的学生才能胜任岗位需求,为了明确具体是哪些专业课、哪些技能是用人单位对应岗位需要的,本发明主要分析简历是否通过筛的数据。

学校的就业信息网记录了来学校招聘的企业的岗位要求以及学生的简历信息;在招聘结束后可由学校从用人单位处获取相应岗位通过简历筛选的学生信息以及未通过简历筛选的学生信息;或者通过学习在学校的就业信息网中填写是否通过简历筛选的信息;将获取到的信息进行整理后得到学校学生的历史就业情况信息,示例性地,如下表1所示,具体包括了岗位名物、岗位要求、学生的标识(如学号、姓名等)、简历(具体包括专业课成绩、技能等)、是否通过简历筛选等。

表1

S2,对岗位要求提取关键词并对关键词进行扩展。

岗位要求通常是描述性地,如通过XXXX、掌握XXXX,为了提取岗位要求中的关键信息,通过关键词提取技术对岗位需求进行关键词提取;优选地,本申请采用jiebaTextrank4zh进行关键词提取。进一步地,为了减少误差,本申请通过预设的词库对关键词进行扩展。

以表1中的数据分析师为例,岗位要求分词及扩展后的关键词如下:

计算机二级、计算机等级考试;

编程语言、Python、Java、C++、GO、JavaScript……;

统计学、统计、数理统计。

S3,对关键词扩展后的岗位要求进行语义分析,并将语义近似的岗位进行聚类,得到第一聚类。

在招聘过程中,用人单位对岗位的名称有自己的习惯叫法,如果仅以岗位名称分类则会造成分类不准确的问题,并且分类过细会造成数据过于分散,每一类数据量过少,产生的分析结果可能不具有代表性,因此需要对类似的岗位进行聚类。

以表1为例,如行情分析师属于数据分析师中的一种,两者对应聘者的要求相似,因此实质上两者可以看成同一类岗位,将数据分析师和行情分析师进行聚类可以获得更多数据,方便进行更准确的分析。语义分析可采用现有技术,本发明不做限定,如词向量距离、word2vec、GloVe等均可;具体地,可将语义相似度大于一预设阈值的岗位归为一类。

还是以表1为例,数据分析师和行情分析师进行聚类后第一聚类包括的简历有20181****1、20181****2、20181****3、20181****7、20181****8、20181****9,这些简历都属于同一岗位类型,可作为后续的分析基础。

S4,对所述第一聚类对应的简历中的专业课成绩相近的简历进行聚类,得到第二聚类。

如表1所示,每一岗位对应了多个简历,则将岗位聚类后依然对应了多个相应的简历;将专业课成绩相似的聚类,由于专业课成绩可以看成是一组向量,可以采用余弦相似度、欧氏距离或者曼哈顿距离来度量成绩之间的相似度,将相似度在预设阈值内的成绩聚类在一起,得到第二聚类,如表2所示。

表2

进一步地,取第二聚类中通过简历通过筛选的简历为第二聚类正样本,取第二聚类中没有通过简历筛选的简历为第二聚类负样本;

将所述第二聚类正样本简历中的技能取交集;示例性地:表2中20181****3的技能为{Python、软考、班长、CET6},表2中20181****9的技能为{Python、网络工程师、CET6},则所述第二聚类正样本简历中的技能取交集结果为{Python、 CET6}。

将所述第二聚类负样本简历中的技能取并集;示例性地:表2中20181****2的技能为{软考、学生会、CET6},表2中20181****8的技能为{CCNA、学生会、CET4},则所述第二聚类正样本简历中的技能取并集结果为{软考、学生会、CET6、CCNA、 CET4}。

对于分数相似的简历,其主要区别在于学生的技能,因此正样本中有用人单位看中的与该招聘岗位相关的技能,但具体是哪些技能则不得而知;而负样本中成绩与正样本相似,表明学生的技能都不与招聘的岗位相关,都不是用人单位所需的,因此将正样本中所有人都有的技能减去负样本中的所有技能则是用人单位最大可能需要的技能。

将所述第二聚类正样本简历中的技能取交集结果与所述第二聚类正样本简历中的技能取并集结果取差集,得到相应岗位的重点技能。示例性地,{Python、CET6} 与{软考、学生会、CET6、CCNA、CET4}的差集为{Python},则Python为对应岗位(示例中的对应岗位即数据分析师和行情分析师)的重点技能。

S5,对所述第一聚类对应的简历中的简历的技能提取关键词,并进行技能相近的简历聚类,得到第三聚类。

由于简历中技能部分通常是描述性地,如掌握XXX语言、通过XXX考试等,因此需要将其中关键的部分提取出来,如掌握Python编程语言、通过CCNA考试,则提取的关键字为{Python、CCNA},提取关键词后可通过词向量进行近似判断,将相似度大于一预定阈值的简历归为一类。

表3

取第三聚类中通过简历通过筛选的简历为第三聚类正样本,取第三聚类中没有通过简历筛选的简历为第三聚类负样本;

对第三聚类正样本的每一门专业课求平均分,示例性地,表3中两位通过简历筛选的数据结构、高等数据、C++程序设计平均分为{91,85.5,91.5}。

对第三聚类负样本的每一门专业课求平均分,示例性地,表3中两位没有通过简历筛选的数据结构、高等数据、C++程序设计平均分为{76,83.5,93.5}。

对于有相似技能的学生,如果简历没有通过筛选说明有用人单位很的重点课程没有学好,因此可以通过各课程的平均分查看哪些课程差距最大,就表明该课程是用人单位的重点专业课。

比较第三聚类正样本的每一门专业课求平均分与第三聚类负样本的每一门专业课求平均分,其中差异最大的为用人单位看重专业课程;在上述示例中数据结构差异最大,简历未通过的主要是数据结构分数低,因此数据结构是对应岗位(示例中的对应岗位即数据分析师和行情分析师)的重点专业课程。

通过上述步骤,本发明分析出了对应岗位的重点技能以及专业课,学校可根据用人单位的重点专业课进行专业建设,如根据分析结果提示加大重点课程的学分,增加重点课程的学时等;学生可根据用人单位的重点技能进行成长建设,如重点学习用人单位的重点技能,通过用人单位的重点考试;学校也可根据重点课程和技能对学生进行成长分析,分析学生简历,如果目标岗位缺少相应技能,则提示学生学习相应的技能,引导学生成长。

需要指出的是,在上述实施例中,岗位聚类会产生多个聚类结果,每个聚类结果对应多个,上述实施例中只描述了对其实一个聚类的操作,而其它聚类都是等同效果,因此其它聚类可以类似地操作;另外,在后续的技能聚类、专业课分数聚类中也是类似的,所有聚类结果都可能是多个,每一种同类型的聚类都是等同效果,可以等同地应用至其它聚类结果中,通过对每一聚类结果递归地实施本发明实施例,可分析完系统中的全部数据。

图2所示,另一方面本申请还公开了一种基于职业能力大数据的专业建设及学生成长分析系统,具体包括:

获取模块,用于获取学校学生的历史就业情况,包括用人单位的招聘岗位信息、通过以及没有通过相应岗位简历筛选的简历详情。

由于面试及笔试的成绩受学生的个人能力影响极大,但只要简历通过筛选即说明相应的学生有用人单位的重点地方,这里的看重是指用人单位认为该岗位真正需要的专业知识或个人技能,一般是学习成绩或者其中一些个人技能,只有部分学科的成绩达到一种程度和/或有部分特征技能的学生才能胜任岗位需求,为了明确具体是哪些专业课、哪些技能是用人单位对应岗位需要的,本发明主要分析简历是否通过筛的数据。

学校的就业信息网记录了来学校招聘的企业的岗位要求以及学生的简历信息;在招聘结束后可由学校从用人单位处获取相应岗位通过简历筛选的学生信息以及未通过简历筛选的学生信息;或者通过学习在学校的就业信息网中填写是否通过简历筛选的信息;将获取到的信息进行整理后得到学校学生的历史就业情况信息,示例性地,如下表1所示,具体包括了岗位名物、岗位要求、学生的标识(如学号、姓名等)、简历(具体包括专业课成绩、技能等)、是否通过简历筛选等。

扩展模块,用于对岗位要求提取关键词并对关键词进行扩展。

岗位要求通常是描述性地,如通过XXXX、掌握XXXX,为了提取岗位要求中的关键信息,通过关键词提取技术对岗位需求进行关键词提取;优选地,本申请采用jiebaTextrank4zh进行关键词提取。进一步地,为了减少误差,本申请通过预设的词库对关键词进行扩展。

以表1中的数据分析师为例,岗位要求分词及扩展后的关键词如下:

计算机二级、计算机等级考试;

编程语言、Python、Java、C++、GO、JavaScript……;

统计学、统计、数理统计。

聚类模块,用于对关键词扩展后的岗位要求进行语义分析,并将语义近似的岗位进行聚类,得到第一聚类。

在招聘过程中,用人单位对岗位的名称有自己的习惯叫法,如果仅以岗位名称分类则会造成分类不准确的问题,并且分类过细会造成数据过于分散,每一类数据量过少,产生的分析结果可能不具有代表性,因此需要对类似的岗位进行聚类。

以表1为例,如行情分析师属于数据分析师中的一种,两者对应聘者的要求相似,因此实质上两者可以看成同一类岗位,将数据分析师和行情分析师进行聚类可以获得更多数据,方便进行更准确的分析。语义分析可采用现有技术,本发明不做限定,如词向量距离、word2vec、GloVe等均可;具体地,可将语义相似度大于一预设阈值的岗位归为一类。

还是以表1为例,数据分析师和行情分析师进行聚类后第一聚类包括的简历有20181****1、20181****2、20181****3、20181****7、20181****8、20181****9,这些简历都属于同一岗位类型,可作为后续的分析基础。

第一分析模块,用于对所述第一聚类中的专业课成绩相近的简历进行聚类,得到第二聚类。

将专业课成绩相似的聚类,由于专业课成绩可以看成是一组向量,可以采用余弦相似度、欧氏距离或者曼哈顿距离来度量成绩之间的相似度,将相似度在预设阈值内的成绩聚类在一起,得到第二聚类,如表2所示。

进一步地,取第二聚类中通过简历通过筛选的简历为第二聚类正样本,取第二聚类中没有通过简历筛选的简历为第二聚类负样本;

将所述第二聚类正样本简历中的技能取交集;示例性地:表2中20181****3的技能为{Python、软考、班长、CET6},表2中20181****9的技能为{Python、网络工程师、CET6},则所述第二聚类正样本简历中的技能取交集结果为{Python、CET6}。

将所述第二聚类负样本简历中的技能取并集;示例性地:表2中20181****2的技能为{软考、学生会、CET6},表2中20181****8的技能为{CCNA、学生会、CET4},则所述第二聚类正样本简历中的技能取并集结果为{软考、学生会、CET6、CCNA、 CET4}。

对于分数相似的简历,其主要区别在于学生的技能,因此正样本中有用人单位看中的与该招聘岗位相关的技能,但具体是哪些技能则不得而知;而负样本中成绩与正样本相似,表明学生的技能都不与招聘的岗位相关,都不是用人单位所需的,因此将正样本中所有人都有的技能减去负样本中的所有技能则是用人单位最大可能需要的技能。

将所述第二聚类正样本简历中的技能取交集结果与所述第二聚类正样本简历中的技能取并集结果取差集,得到相应岗位的重点技能。示例性地,{Python、CET6} 与{软考、学生会、CET6、CCNA、CET4}的差集为{Python},则Python为对应岗位(示例中的对应岗位即数据分析师和行情分析师)的重点技能。

第二分析模块,用于对所述第一聚类中的简历的技能提取关键词,并进行技能相近的简历聚类,得到第三聚类。

由于简历中技能部分通常是描述性地,如掌握XXX语言、通过XXX考试等,因此需要将其中关键的部分提取出来,如掌握Python编程语言、通过CCNA考试,则提取的关键字为{Python、CCNA},提取关键词后可通过词向量进行近似判断,将相似度大于一预定阈值的简历归为一类。

取第三聚类中通过简历通过筛选的简历为第三聚类正样本,取第三聚类中没有通过简历筛选的简历为第三聚类负样本;

对第三聚类正样本的每一门专业课求平均分,示例性地,表3中两位通过简历筛选的数据结构、高等数据、C++程序设计平均分为{91,85.5,91.5}。

对第三聚类负样本的每一门专业课求平均分,示例性地,表3中两位没有通过简历筛选的数据结构、高等数据、C++程序设计平均分为{76,83.5,93.5}。

对于有相似技能的学生,如果简历没有通过筛选说明有用人单位很的重点课程没有学好,因此可以通过各课程的平均分查看哪些课程差距最大,就表明该课程是用人单位的重点专业课。

比较第三聚类正样本的每一门专业课求平均分与第三聚类负样本的每一门专业课求平均分,其中差异最大的为用人单位看重专业课程;在上述示例中数据结构差异最大,简历未通过的主要是数据结构分数低,因此数据结构是对应岗位(示例中的对应岗位即数据分析师和行情分析师)的重点专业课程。

通过上述步骤,本发明分析出了对应岗位的重点技能以及专业课,学校可根据用人单位的重点专业课进行专业建设,如在系统中增加提示模块,在用户界面中,如web、客户端等位置根据分析结果提示加大重点课程的学分,增加重点课程的学时等;学生可根据用人单位的重点技能进行成长建设,如重点学习用人单位的重点技能,通过用人单位的重点考试;学校也可根据重点课程和技能对学生进行成长分析,分析学生简历,如果目标岗位缺少相应技能,则提示学生学习相应的技能,引导学生成长。

需要指出的是,在上述实施例中,岗位聚类会产生多个聚类结果,每个聚类结果对应多个,上述实施例中只描述了对其实一个聚类的操作,而其它聚类都是等同效果,因此其它聚类可以类似地操作;另外,在后续的技能聚类、专业课分数聚类中也是类似的,所有聚类结果都可能是多个,每一种同类型的聚类都是等同效果,可以等同地应用至其它聚类结果中,通过对每一聚类结果递归地实施本发明实施例,可分析完系统中的全部数据。

需要特别指出的是,本发明实施例中的数据仅为方便描述而示例地,在一定程度上进行了简化,在具体实现中数据量通常会比较大,并且较详细。

在本申请中,术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号