首页> 中国专利> 一种企业人才流失的数据挖掘分析方法及装置

一种企业人才流失的数据挖掘分析方法及装置

摘要

本发明公开了一种企业人才流失的数据挖掘分析方法及装置,该装置至少包括:数据源模块,对通过企业薪酬系统和人力资源系统所收集到的员工信息数据进行预处理、清理、集成与转换,并保存到数据收集服务器中;员工分类模块,使用聚类分析方法对数据源模块的数据进行聚类分析,将员工进行聚类,得到员工的聚类结果;员工流失规律分析模块,根据聚类分析的结果,利用面向员工流失分析的关联规则模型,将员工的分类信息同在职与流失的状态进行关联,对导致员工流失的因素进行因果关系的分析,本发明能够对模具企业人才流失进行分析预测,得到人才流失规律,同时得到每个员工的流失率并可对高流失率员工计算出员工的参考薪酬。

著录项

  • 公开/公告号CN104809188A

    专利类型发明专利

  • 公开/公告日2015-07-29

    原文格式PDF

  • 申请/专利权人 广东工业大学;

    申请/专利号CN201510187936.4

  • 申请日2015-04-20

  • 分类号

  • 代理机构北京精金石专利代理事务所(普通合伙);

  • 代理人刘晔

  • 地址 510006 广东省广州市越秀区东风东路729号

  • 入库时间 2023-12-18 10:12:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-03

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20160323 终止日期:20190420 申请日:20150420

    专利权的终止

  • 2016-03-23

    授权

    授权

  • 2015-08-26

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150420

    实质审查的生效

  • 2015-07-29

    公开

    公开

说明书

技术领域

本发明涉及数据分析技术领域,特别涉及一种模具企业人才流失的数据挖掘分析方法及装置。

背景技术

模具有着“工业之母”之称,是制造业中重要的成型方法之一,可见,模具行业在现代工业中所占的重要地位。然而,模具产品有着复杂多变的特点,使得有经验的模具技术人员在模具制造中发挥着重要作用,所以在模具企业中对模具人才流失进行分析是不可或缺的。

在企业中,新员工可以弥补老员工流失的损失,不过需要经过长期的培训同经验的累计,才能真正替代流失的老员工及模具人才。这过程将为公司增加了招聘成本、人才培养的时间成本与培训成本。相比较新员工,模具企业里的老手员工熟悉企业自身的订单类型与生产状况,能够更好的适应多变的产品生产加工需求。留住人才,降低人才流失率是模具企业人才管理战略上必须关注的方向。

然而,传统的人才流失分析主要是采取调查问卷,个体访谈等方式来进行分析,存在着以下的一些缺点:

传统人才流失分析的分析方法:

1)问卷调查方式,发放调查问卷进行薪资,去留意向等的调查;

2)个体访谈,对于特别突出的有离职倾向的个别员工进行访谈;

3)将获取的资料进行手工分析统计以及输入统计分析软件或EXCEL办公软件进行分析。

以上分析方法的缺点:

(1)访谈和调查问卷所制定的分析规则受到分析员的主观影响,无法客观反映事实;

(2)由于访谈需要提及员工对人际关系或工作环境等涉及到隐私的想法则会使得员工在具体表述的时候有所保留且会出现信息错误的现象;

(3)访谈及调查问卷可获得离职的原因,但都只是比较表面和广泛;

(4)调查问卷内容设计和编排到统计分析问卷,需要投入很大的人力物力有悖于企业高效率的原则。

通过以上的分析方法使得模具企业里的人力资源管理在人才流失分析中遇到了以下五个问题:

分析过程遇到的问题:

1)当企业员工较多时,难以对员工进行分类管理;

2)难以从综合的角度描述企业现有员工的现状;

3)难以对离职员工的员工特点进行归纳;

4)无法预测员工在短期内离职的可能性;

5)由于各个员工类别的差异较大,合理的参考薪酬则难以制定。

针对上述五个问题,传统的管理学难以得出科学的结果。因此,需要借助先进的数据分析方法。探索出一套能广泛适用于模具企业,乃至制造业人员流失问题的数据分析方法是十分重要的。

发明内容

为克服上述现有技术存在的不足,本发明之主要目的在于提供一种企业人才流失的数据挖掘分析方法及装置,其通过从所收集到的员工信息数据,并加以整合,使用聚类的数据挖掘方法,根据员工属性的差异程度进行细分,以使企业能够根据细分的结果,对每一类别的员工进行深入的了解,并清楚认识企业人力资源的构成状况。

本发明之另一目的在于提供一种企业人才流失的数据挖掘分析方法及装置,其b)基于关联规则进行员工流失相关因素探究,挖掘员工流失规律,能够为企业改善薪酬福利、人员任用提供参考。

本发明之又一目的在于提供一种企业人才流失的数据挖掘分析方法及装置,其通过基于Logistic回归的流失率预测,预测员工未来一段时间内离职的可能性,得出流失概率值,使企业管理人员可以在所得的分析结果中,预先知道哪些关键员工在客观的数据分析结果中更有可能会选择离职,并提前对该部分员工做出相应的激励与挽留措施。

本发明之再一目的在于提供企业人才流失的数据挖掘分析方法及装置,其通过基于决策树的参考薪酬估计,将流失概率较低的员工作为参考薪酬制定的依据,并且为高流失可能性的员工重估薪酬,作为一个降低流失率的参考薪酬。

为实现上述目的,本发明一种企业人才流失的数据挖掘分析装置,其特征在于,该数据挖掘分析装置至少包括:

数据源模块,对通过企业薪酬系统和人力资源系统所收集到的员工信息数据进行预处理、清理、集成与转换,并保存到数据收集服务器中,作为其他功能模块的数据源;

员工分类模块,使用聚类分析方法对所述数据源模块的数据进行聚类分析,将员工进行聚类,得到员工的聚类结果

员工流失规律分析模块,根据聚类分析的结果,利用面向员工流失分析的关联规则模型,将员工的分类信息同在职与流失的状态进行关联,对导致员工流失的因素进行因果关系的分析。

进一步地,所述数据挖掘分析装置还包括:

员工流失率预测模块,在聚类分析的基础上,为每一个聚类建立一个流失率预测模型,使用Logistic回归对员工流失率进行预测。

参考薪酬模块,在获得每一个员工流失率的基础上,运用决策树模型为流失率高的员工提出合理的参考薪酬段。

进一步地,所述数据源模块包括数据处理器及与其连接的工作流引擎、数据收集服务器和交换机,所述工作流引擎连接多个客户端,所述交换机连接有人力资源系统数据服务器和薪酬系统数据服务器,所述数据处理器利用所述交换机与所述企业薪酬系统和人力资源系统的数据服务器连接,所述数据处理定时发送连接数据服务器的请求,成功连接所述数据服务器后,所述数据处理器向所述数据服务器发送抽取数据的服务请求;所述数据服务器响应后,根据所述数据处理器传入的参数和指令,将数据复制到所述数据处理器中;所述数据处理器对收集到的数据进行预处理,对数据进行抽取、转化与加载,并根据事先所需的输入变量与输出变量建立起的模型将预处理的数据输出整合并加载到其中;将模型中的数据加载到相应的分析模块中供分析使用;所述数据处理器将处理好的数据上传到所述数据收集服务器中保存。

进一步地,所述员工分类模块包括分类引擎及其连接的分类分件,所述分类引擎与分类文件连接所述数据处理器,所述分类文件根据员工信息中有线性相关的变量进行合并,使得所述数据处理器可筛选和过滤比较旧的历史数据,所述分类引擎将数据填充到聚类分析的模型,使得属性相似度较高的员工细分到同一个聚类中,并输出聚类分析的结果。

进一步地,所述员工流失规律分析模块包括关联规则引擎及与其连接的关联规则接口,所述关联规则引擎与所述分类引擎连接,在根据所述员工分类模块将企业的人力资源的员工类别进行细分的基础上,将所述分类引擎所得到的数据填充到预先在所述关联规则引擎中建立的面向员工流失分析的关联规则模型中,该模型将员工的分类信息同在职与流失的状态进行关联;设定关联阈值,以此来界定关联最多的频繁项目变量;通过关联规则引擎中的模型得出影响员工流失的规律。

进一步地,所述员工流失率预测模块包括流失率预测引擎及与其连接的流失率预测接口,所述流失率预测引擎连接所述分类引擎,在所述员工分类模块将企业的人力资源中的员工类别进行细分的基础上,将所述分类引擎所得到的数据填充到流失率预测建立的模型中,并为每一个聚类都建立一个流失率预测模型;设定流失预警线,以此来划分出高流失员工和低流失员工的界限;运行模型后得到每一个员工的流失概率值。

进一步地,所述参考薪酬模块包括参考薪酬计算引擎及与其连接的参考薪酬计算接口,所述参考薪酬计算引擎连接所述流失率预测引擎,根据员工流失率预测模块可以预测每一位员工的流失率,将员工分为稳定型员工与高流失率员工;将流失率预测引擎中得到的稳定型员工填充到所述参考薪酬计算引擎建立的决策树模型,探索稳定型员工的薪酬水平与员工属性的关系;对高流失率的员工进行新的参考薪酬计算,分析其合理性;输出稳定型员工的薪酬水平与员工属性的关系。

为达到上述目的,本发明还提供一种企业人才流失的数据挖掘分析方法,包括如下步骤:

步骤一,对通过企业薪酬系统和人力资源系统所收集到的员工信息数据进行预处理、清理、集成与转换,并保存到数据收集服务器中;

步骤二,使用聚类分析方法对数据收集服务器中的数据进行聚类分析,将员工进行聚类,得到员工的聚类结果;

步骤三,根据据聚类分析的结果,利用面向员工流失分析的关联规则模型,将员工的分类信息同在职与流失的状态进行关联,对导致员工流失的因素进行因果关系的分析。

进一步地,所述方法还包括如下步骤:

在聚类分析的基础上,为每一个聚类建立一个流失率预测模型,使用Logistic回归对员工流失率进行预测。

进一步地,所述方法还包括如下步骤:

在获得每一个员工流失概率的基础上,运用决策树模型为流失率高的员工计算出合理的参考薪酬段。

与现有技术相比,本发明一种企业人才流失的数据挖掘分析方法及装置根据数据挖掘的技术,首先通过使用聚类分析将员工进行聚类,将员工的特性进行总结和分类,其次根据关联规则,对导致员工流失的因素进行因果关系的分析,再者使用Logistic回归对员工流失率进行预测,对员工的流失倾向进行定义,进而提前做好补救措施,最后运用决策树为流失率高的员工提出合理的参考薪酬段,本发明使得人才流失的数据化分析方法能够普遍适用于模具企业。

附图说明

图1为本发明一种企业人才流失的数据挖掘分析装置的系统架构图;

图2为本发明较佳实施例中数据源模块10的结构示意图;

图3为本发明较佳实施例中员工分类模块20的结构示意图;

图4为本发明较佳实施例中员工流失规律分析模块30的结构示意图;

图5为本发明较佳实施例中员工流失率预测模块40的结构示意图;

图6为本发明较佳实施例中参考薪酬模块50的结构示意图;

图7为本发明一种企业人才流失的数据挖掘分析方法的步骤流程图;

图8为本发明较佳实施例中企业人才流失的数据挖掘分析方法的细部流程图。

具体实施方式

为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。

图1为本发明一种企业人才流失的数据挖掘分析装置的系统架构图。如图1所示,本发明一种企业人才流失的数据挖掘分析装置,包括数据源模块10、员工分类模块20、员工流失规律分析模块30、员工流失率预测模块40和参考薪酬模块50。

其中,数据源模块10对通过企业薪酬系统和人力资源系统所收集到的员工信息数据进行预处理、清理、集成与转换,并保存到数据收集服务器中,作为其他功能模块的数据源;员工分类模块20,使用聚类分析方法对数据源模块10的数据进行聚类分析,将员工进行聚类,得到员工的聚类结果;员工流失规律分析模块30,根据聚类分析的结果,利用面向员工流失分析的关联规则模型,将员工的分类信息同在职与流失的状态进行关联,对导致员工流失的因素进行因果关系的分析;员工流失率预测模块40,在聚类分析的基础上,为每一个聚类建立一个流失率预测模型,使用Logistic回归对员工流失率进行预测;参考薪酬模块50,在获得每一个员工流失率的基础上,运用决策树模型为流失率高的员工提出合理的参考薪酬段。

图2为本发明较佳实施例中数据源模块10的结构示意图。如图2所示,数据源模块10,包括数据处理器101及与其连接的工作流引擎102、数据收集服务器103和交换机104,工作流引擎102还连接有多个客户端105,交换机104还连接有人力资源系统数据服务器106和薪酬系统数据服务器107。数据源模块10的运行步骤为:使用TCP/IP接口和实现数据交互的交换机104将企业薪酬系统和人力资源系统的数据服务器(106/107)与本发明的数据处理器101连接起来;数据处理器101则按设定的时间间隔,定时发送连接数据服务器(106/107)的请求;成功连接数据服务器(106/107)后,数据处理器(101)向数据服务器(106/107)发送抽取数据的服务请求;数据服务器(106/107)响应后,根据数据处理器(101)传入的参数和指令,将数据复制到数据处理器(101)中;数据处理器对收集到的数据进行预处理,对数据进行抽取、转化与加载的过程;根据事先所需的输入变量与输出变量建立起的模型将预处理的数据输出整合并加载到其中;将模型中的数据加载到相应的分析模块中供分析使用;数据处理器(101)将处理好的数据上传到数据收集服务器(108)中保存。可见,数据源模块101的功能在于把所需数据处理后并保存到分析数据源服务器中,作为本发明其他功能模块的数据源,供其他模块分析使用。

图3为本发明较佳实施例中员工分类模块20的结构示意图。如图3所示,员工分类模块20,包括分类引擎201及与其连接分类文件202、分类接口203和可视化引擎204,其中,分类引擎201连接数据源模块10的数据处理器101,可视化引擎204和分类接口203之间还连接有可视化接口205和显示器206,数据处理器101还连接数据收集服务器108,分类文件202还与数据处理器101相连接。员工分类模块20运行步骤为:通过接口连接员工分类模块,对员工进行分类;分类文件根据员工信息中有线性相关的变量进行合并,使得数据处理器101可以筛选和过滤比较旧的历史数据;分类引擎201将数据填充到聚类分析的模型,使得属性相似度较高的员工细分到同一个聚类中;输出聚类分析的结果,并可以查看到按不同的工种、年龄、学历为主要属性的员工聚类结果,快速全面地了解人力资源的状况;根据以上步骤得出的聚类结果进行可视化的操作,通过可视化引擎204将相关的数据按照离职与否以及相关的员工信息等显示出来,通过链接可视化接口可以查看到相关的员工细分的类别情况。

图4为本发明较佳实施例中员工流失规律分析模块30的结构示意图。如图4所示,,员工流失规律分析模块30包括关联规则引擎301及与其连接关联规则接口302和可视化引擎303,其中,关联规则引擎301与分类引擎201连接,关联规则接口302和可视化引擎303之间还连接有可视化接口304和显示器305,分类引擎201还连接数据处理器101,数据处理器101还连接数据收集服务器108。员工流失规律分析模块的运行步骤为:在根据员工分类模块20将企业的人力资源的员工类别进行细分的基础上通过接口连接员工流失规律分析模块,对员工进行流失规律的分析;将分类引擎201所得到的数据填充到预先在关联规则引擎中建立的面向员工流失分析的关联规则模型中,该模型将员工的分类信息同在职与流失的状态进行关联;设定关联阈值,以此来界定关联最多的频繁项目变量;通过关联规则引擎中的模型得出影响员工流失的重要规律;用户通过链接可视化接口可以查看到相关的员工流失规律,并做出相关的举措。

图5为本发明较佳实施例中员工流失率预测模块40的结构示意图。如图5所示,员工流失率预测模块40,包括流失率预测引擎401及与其连接可视化引擎402和流失率预测接口403,其中流失率预测引擎401连接分类引擎201,流失率预测接口403和可视化引擎402之间还连接有可视化接口404和显示器405,分类引擎201还连接数据处理器101,数据处理器101还连接数据收集服务器101。员工流失率预测模块40的运行步骤为:在员工分类模块20将企业的人力资源中的员工类别进行细分的基础上,通过接口连接员工流失率预测模块40,对每个员工的流失率进行预测分析;将分类引擎201所得到的数据填充到流失率预测建立的模型中,并为每一个聚类都建立一个流失率预测模型;设定流失预警线,以此来划分出高流失员工和低流失员工的界限;运行模型后将得到每一个员工的流失概率值;用户通过链接可视化接口可以查看到相关的员工流失规律,并将员工分为稳定型员工与高流失率员工。

图6为本发明较佳实施例中参考薪酬模块50的结构示意图。如图6所示,参考薪酬模块50包括参考薪酬计算引擎501及与其连接的可视化引擎502和参考薪酬计算接口503,其中参考薪酬计算引擎501连接流失率预测引擎401,参考薪酬计算接口503和可视化引擎502之间还连接有可视化接口504和显示器505,流失率预测引擎通过分类引擎201连接数据处理器101,数据处理器101还连接数据收集服务器108。参考薪酬模块的运行步骤为:根据员工流失率预测模块可以预测每一位员工的流失率,将员工分为稳定型员工与高流失率员工;通过接口连接参考薪酬计算模块;将流失率预测引擎中得到的稳定型员工填充到参考薪酬计算引擎建立的决策树模型,探索稳定型员工的薪酬水平与员工属性的关系;对高流失率的员工进行新的参考薪酬计算,分析其合理性;用户通过链接可视化接口可以查看到稳定型员工的薪酬水平与员工属性的关系,以此来对比高流失率的相关属性。

图7为本发明一种企业人才流失的数据挖掘分析方法的步骤流程图。如图7所示,本发明一种企业人才流失的数据挖掘分析方法,包括如下步骤:

步骤701,对通过企业薪酬系统和人力资源系统所收集到的员工信息数据进行预处理、清理、集成与转换,并保存到数据收集服务器中。具体地说,数据处理器定时从企业薪酬系统和人力资源系统中抽取数据,根据模具企业人力资源情况和数据挖掘分析所需要的数据类型,进行数据的预处理、清理、集成与转换,并将处理好的数据上传到数据收集服务器中予以保存。

步骤702,使用聚类分析方法对数据收集服务器中的数据进行聚类分析,将员工进行聚类,得到员工的聚类结果。具体地说,首先将员工进行预分类,例如将员工预分类为管理人员、技术人员和普通员工,然后自定义聚类数,执行两步聚类算法对员工再次细分,这样很好地解决了在对员工进行细分时存在多个数值变量和分类变量的难题,通过聚类分析全面展现了企业的人力资源状况。

步骤703,根据据聚类分析的结果,利用面向员工流失分析的关联规则模型,将员工的分类信息同在职与流失的状态进行关联,对导致员工流失的因素进行因果关系的分析。在本步骤中,针对前步骤同时涉及到多个数值变量和分类型变量的难题,采用GRI算法建立面向员工流失分析的关联规则模型,并设定相应的前项最小支持度、最小的规则置信度、前项中包含的最大项目数、最大的生成规则数目,得到影响员工流失的重要规律。

较佳的,在步骤702之后,本发明之数据挖掘分析方法还包括如下步骤:在聚类分析的基础上,为每一个聚类建立一个流失率预测模型,使用Logistic回归对员工流失率进行预测。具体地说,本步骤中,对各个聚类的数值型变量进行主成分分析,用主成分作为输入变量,分别对各个聚类建立基于Logistic回归分析的面向企业员工流失率预测模型,通过模型得到每一个员工的流失率并根据这个概率建立员工流失预警线。

较佳的,本发明之数据挖掘分析方法还包括如下步骤:在获得每一个员工流失概率的基础上,运用决策树模型为流失率高的员工提出合理的参考薪酬段。具体地说,本步骤基于员工流失率预测模型的结果,对稳定性员工进行分类回归树分析,建立模型,挖掘稳定型员工的薪酬与他们的员工属性的规律,将分类回归树所挖掘的规律应用到高流失率员工群上,对其进行参考薪酬的计算,作为制定预防员工流失的薪酬调整激励办法的参考依据。

图8为本发明较佳实施例中企业人才流失的数据挖掘分析方法的细部流程图。在本发明较佳实施例中,以模具企业为例,本发明之模具企业人才流失的数据挖掘分析方法的流程如图8所示,数据处理器定时从企业薪酬系统和人力资源系统中抽取数据,根据模具企业人力资源情况和数据挖掘分析所需要的数据类型,进行数据的预处理、清理、集成与转换;在数据转换后,根据企业的实际情况进行变量筛选,得到管理人员、技术人员和普通员工三个预分类,在自定义聚类数后执行两步聚类模型,得到员工细分结果;根据员工细分结果,针对前一步骤同时涉及到多个数值变量和分类型变量的难题,运用主成分分析处理方法,设定相应的前项最小支持度、最小的规则置信度、前项中包含的最大项目数、最大的生成规则数目,基于GRI算法建立面向员工流失分析的关联规则模型,得到影响员工流失的重要规律,为企业能更好地制定防止关键员工流失的对策提供参考依据;根据员工细分的聚类结果,对各个聚类的数值型变量进行主成分分析,用主成分作为输入变量,分别对各个聚类基于Logistic回归分析建立面向企业员工流失率预测模型,通过模型得到每一个员工流失的概率并以此建立员工流失预警线;根据计算的员工流失概率,将员工分成出高流失率员工和稳定性员工,先以稳定型员工为样本进行分类回归树分析,该分析能够根据学历、年龄、工龄、部门、职位等属性,挖掘出这些输入变量与薪酬之间的关系,在进行模型调整后便可以将分类回归树所挖掘的规律应用到高流失率员工群上,对其进行参考薪酬的计算。

本发明能够对模具企业人才流失进行分析预测,得到人才流失规律,同时得到每个员工的流失率并可以对高流失率员工计算出员工的参考薪酬,为挽留企业人才做出实际的贡献,总体来说有以下三个优点:

(1)高效的数据分析能力,本发明对海量的企业数据进行智能和自动的分析,尤其是在模具企业中针对的大量员工和不同的信息处理,更加快速地发掘出隐藏的关联关系和较隐蔽的属性,提高了原有的数据分析的效率和速度;

(2)全面而又准确的覆盖范围,数据实时获取,动态分析,本发明是使用了人力资源系统,薪酬系统(有些人力资源系统已包含薪酬系统)中的数据库数据,数据覆盖到所有的员工,信息全面且准确,并按照统一的规范保存。分析数据源服务器可实时从系统中获取数据供分析模块使用,本发明可对数据进行动态分析,方便企业人员快速应对企业人力资源的变化;

(3)方便快捷地得到分析结果,过程可视化。本发明操作简单,不需要复杂的步骤,易用性高,非常适合人力资源的员工和人力资源经理等高层使用,而且在分析过程中不与员工直接接触所以得到的结果是比较客观而且真实。

最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号