公开/公告号CN113065969A
专利类型发明专利
公开/公告日2021-07-02
原文格式PDF
申请/专利权人 开鑫金服(南京)信息服务有限公司;
申请/专利号CN202011387218.9
发明设计人 周秀丽;
申请日2020-12-02
分类号G06Q40/06(20120101);
代理机构11762 北京一品慧诚知识产权代理有限公司;
代理人邓树山
地址 210012 江苏省南京市雨花台区安德门大街50号怡化华东运营研发中心C座3楼开鑫金服
入库时间 2023-06-19 11:42:32
技术领域
本发明涉及数据分析技术领域,具体涉及一种企业评分模型构建方法、企业评分方法、介质和电子设备。
背景技术
当前,企业(以下以地方国企为例)融资信用评级主要采用专业评级机构的主体评级结果,将宏观环境及地区综合实力、企业规模作为基础评分模型,专营地位、经营能力、债务及偿债保障、公司治理与发展战略、财务信息质量、流动性及外部支持作为调整影响因素以进行最终评级结果的确定。并且,评级结果检验方法包括信用迁徙矩阵检验、违约率检验和利差分析检验,其中,信用迁徙矩阵主要用于检验级别的稳定性,违约率和利差分析主要用于检验级别的一致性。在评价国企平台的违约风险上具有专业性和权威性,但在具体应用场景中存在企业外部评级普遍为AA级(含)以上的高评级,且评级区分度较小,例如江苏省有384户基础设施类企业发债主体,其中60.16%的主体外部评级为AA级。
在具体的地方国有企业融资业务中,针对不同企业,需要准确度较高的信用评分,以进行差别化的风控策略的部署。
当前地方国企融资业务中,专业评级机构的主体评级结果的权威性,成为业务开展准入的重要参考指标,但在具体业务的精细化管理需求中,需要结合不同国企的地区特征、财务情况等维度进行差异化的违约风险评分,当前的地方国企评级主要采用专家评价法,以分档的形式发布(例如A,AA,AAA等),不能满足各金融机构差别化、及时性的企业风险评级需求。
传统地方国企信用评级的参考指标主要为地区经济数据和企业财务数据,辅助专营地位、经营能力、债务及偿债保障、公司治理与发展战略、财务信息质量、流动性及外部支持等作为调整影响因素。存在维度不全面、标准不够规范、结果偏差较大等问题,第一,工商数据、司法数据、舆情数据等影响因素缺失,第二,且由于评级机构的评级存在滞后性,难以动态的监测国企平台的违约风险,以做到及时预警及跟踪,第三,最终评级结果还需要依据各专家委员的主观经验判断,而专家委员往往都会考虑超出评级模型范围的更多影响因素,使得最终评级结果不但带有主观影响的成分,并且往往会与评级模型指示的结果存在较大差异。
发明内容
本发明所要解决的技术问题是:提供一种结合企业融资业务中的业务经验及数据积累,综合运用数据分析方法形成的企业评分模型构建方法、企业评分方法、介质和电子设备。
为了解决上述技术问题,本发明采用的第一种技术方案为:
一种企业评分模型构建方法,包括
指标体系确认步骤,结合评价要素与第三方数据设立包括影响因素的指标体系;
指标准备及衍生步骤,进行指标体系的整合,并进行变量衍生;
参数设置步骤,对数据处理以及后续建模所需的第三方包的加载;
变量清洗步骤,包括变量降维、变量转化以及变量缺失值填充;
模型开发及评估步骤,构造判断矩阵,计算各层中各影响因素的权重,评价判断矩阵的有效性,进行一致性检验。
为了解决上述技术问题,本发明采用的第二种技术方案为:
一种企业评分方法,包括:
采用通过一致性检验的上述的企业评分模型构建方法所构建的企业评分模型进行评分。
为了解决上述技术问题,本发明采用的第三种技术方案为:
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的企业评分方法。
为了解决上述技术问题,本发明采用的第四种技术方案为:
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的企业评分方法。
本发明的有益效果在于:本申请通过结合企业融资业务中的业务经验及数据积累,综合运用数据分析方法,形成兼具权威、全面、可推广的地方企业评分指标体系;相比于当前头部信用评级公司的分级评级标准,运用AHP层次分析法,提供差异化的企业评分结果,方便采取不同标准的风控措施;提供全流程的数据清洗、数据建模、数据检验的一体化方案,节省研发效率。
附图说明
图1为本发明具体实施方式的一种企业评分模型构建方法的流程图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种企业评分模型构建方法,包括
指标体系确认步骤,结合评价要素与第三方数据设立包括影响因素的指标体系;
指标准备及衍生步骤,进行指标体系的整合,并进行变量衍生;
参数设置步骤,对数据处理以及后续建模所需的第三方包的加载;
变量清洗步骤,包括变量降维、变量转化以及变量缺失值填充;
模型开发及评估步骤,构造判断矩阵,计算各层中各影响因素的权重,评价判断矩阵的有效性,进行一致性检验。
进一步的,所述评价要素包括国际和国内的评级机构的评级要素;
所述第三方数据包括地方经济情况、企业财务情况、工商数据、司法数据、舆情数据、行业趋势以及企业融资业务累计数据。
进一步的,所述影响因素包括经济实力、财政实力、经营与竞争实力、财务实力、风险分析;
所述经济实力包括地区生产总值、地区生产总值增长率、地区生产总值占全国比重、地区城投债余额以及政府债务率指标;
所述财政实力包括一般预算收入、一般预算收入增长率、财政自给率、是否百强、财政贡献度指标;
所述经营与竞争实力包括企业层级、外部评级、资产规模占比、债务余额与有息债务的比值、地方综合财力弹性、城市首位度指标;
所述财务实力包括总资产、资产负债率、营业总收入、销售收现比指标;
所述风险分析包括负面舆情、股权出质、法定代表人变更、财务信息质量、或有负债、重大诉讼指标。
进一步的,所述指标体系的指标来自第三方数据,并根据原始数据进行变量衍生。
所述指标的归集和衍生指标的加工通过SQL语句在MySQL中实现,并将数据导入Rstudio中。
进一步的,所述第三方包的加载包括plyr包、tidyverse包、rlist包、caret 包以及ahp函数包。
所述plyr包用于处理R内部或者外部的结构化数据;
所述tidyverse包用于数据处理与可视化;
所述rlist包用于非结构化数据的处理;
所述caret包具有数据预处理,特征选择,建模与参数优化,模型预测与检验功能;
所述ahp函数包可进行决策的可视化和建模;
所有加载包通过R程序自带的library函数进行加载。
进一步的,所述变量降维包括:
去除缺失值较高的指标、在Rstudio中,通过sapply函数计算每个变量的缺失值,如果变量缺失率大于90%,则从变量中提取的数据信息较少需要删除;
去除集中度较高的指标、在Rstudio中,通过sapply函数计算指标值频率出现最高次数占总样本数量的比例,如果集中度大于90%,则变量可取的信息较少需要删除;
所述变量转化包括两类;
一类是针对有缺失值变量的处理,如果变量缺失率在警戒线以下,阈值以上,则可以考虑将变量转化为二分类变量;
另一类是分类变量的处理,将分类变量转化成两个0/1变量;
所述变量缺失值填充使用preProcess函数,采用medianImpute方法用选用数据集中对应变量的中值来填充样本的缺失值;
基于以上数据处理流程,保留样本集中经过筛选和转化后的变量。
进一步的,所述模型开发包括:
第一、运用cor函数对所有变量进行相关性检验,对相关性系数高于0.9的变量进行剔除;
第二、设定指标的标度和含义,建立影响因素的系数矩阵和各个指标之间的系数矩阵;
第三、确定选项和选项分值,对每个评价指标设定4个选项,得出判断系数矩阵,计算出权重并赋予分值;对选项判断矩阵用AHP层次分析法计算出权重;将指标选项中得分最高的选项依次设定为A、B、C、D选项,总分为100 分,根据上述权重计算出每个选项的分值;
第四、建立一致性检验,判断矩阵的一致性,CRtest包调用weight函数,所述CRtest包包括一致性比率CR,所述CR<0.10则矩阵通过一致性检验;
第五、最终评分结果核验,与主要评级机构的企业评级结果进行交叉比对,以验证评级结果的准确性。
一种企业评分方法,包括:
采用通过一致性检验的上述的企业评分模型构建方法所构建的企业评分模型进行评分。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的企业评分方法。
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的企业评分方法。
从上述描述可知,本发明的有益效果在于:本申请通过结合企业融资业务中的业务经验及数据积累,综合运用数据分析方法,形成兼具权威、全面、可推广的地方企业评分指标体系;相比于当前头部信用评级公司的分级评级标准,运用AHP层次分析法,提供差异化的企业评分结果,方便采取不同标准的风控措施;提供全流程的数据清洗、数据建模、数据检验的一体化方案,节省研发效率。
所述AHP层次分析法:简称AHP,是指将与决策有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。
所述Dummy处理:对类别变量进行“二进制化”操作,类别大于2时,每个类别均转化为0/1哑变量。
实施例一
一种企业评分模型构建方法,包括
步骤一、指标体系确认步骤,结合国际和国内权威评级机构评价要素,结合地区国企融资业务累积数据及第三方数据,从经济实力、财政实力、经营与竞争实力、财务实力、风险分析五个维度(影响因素)设立指标体系。
步骤二、指标准备及衍生,评分主要包括五大维度,第一类是经济实力(包括地区生产总值、地区生产总值增长率、地区生产总值占全国比重、地区城投债余额、政府债务率等指标),第二类是财政实力(包括一般预算收入、一般预算收入增长率、财政自给率、是否百强、财政贡献度等指标),第三类是经营与竞争实力(企业层级、外部评级、资产规模占比、债务余额与有息债务的比值、地方综合财力弹性、城市首位度等指标),第四类是财务实力(包括总资产、资产负债率、营业总收入、销售收现比等指标),第五类是风险分析(包括负面舆情、股权出质、法定代表人变更、财务信息质量、或有负债、重大诉讼等指标) 指标来自第三方数据机构,并根据原始数据进行变量衍生,最终生成50个指标 (经验值);以江苏省发债地方国企为例,数据时间范围选取江苏省发债地方国企的全量数据,共384户;指标的归集和衍生指标的加工都通过SQL语句在MySQL中实现,将数据导入Rstudio中,以备下一步数据的清洗和模型加工。
步骤三、参数设置,参数设置主要是对于数据处理及建模过程中需要用到的第三方包进行加载,包括plyr包(用于处理R内部或者外部的结构化数据)、 tidyverse包(用于数据处理与可视化)、rlist包(用于非结构化数据的处理)、caret 包(具有数据预处理,特征选择,建模与参数优化,模型预测与检验等功能)、 ahp函数包(可进行决策的可视化和建模)等,所有加载包通过R程序自带的 library函数进行加载。
步骤四、变量清洗,主要包括变量降维、变量转化、变量缺失值填充。变量降维包括二个步骤;
步骤四一、去除缺失值较高的指标,在Rstudio中,可通过sapply函数计算每个变量的缺失值,如果变量缺失率大于90%,则从变量中提取的数据信息较少需要删除;
步骤四二、是去除集中度较高的指标,在Rstudio中,可通过sapply函数计算指标值频率出现最高次数占总样本数量的比例,如果集中度大于90%,则变量可取的信息较少需要删除;
变量转化主要为两类,一类是针对有缺失值变量的处理,如果变量缺失率在警戒线(90%)以下,阈值(85%)以上,则可以考虑将变量转化为二分类变量,
另一类是分类变量的处理,将分类变量(例如用户类别指标包含多个类别) 转化成两个0/1变量,也称作dummy处理,目的是便于机器学习;
缺失值填充一般是用preProcess函数,采用medianImpute方法用选用数据集中对应变量的中值来填充样本的缺失值;基于以上数据处理流程,保留样本集中经过筛选和转化后的变量,以备模型加工过程使用。
步骤五、评分模型建立,模型加工主要分为五个重要步骤,
步骤五一、首先运用cor函数对所有变量进行相关性检验,对相关性系数高于0.9的变量进行剔除。
步骤五二、设定指标的标度和含义,建立影响地方国企评分的5大影响因素的系数矩阵和各个指标之间的系数矩阵。
所述指标的标度和含义参照下表,其中影响因素之间的比较为人为规定,由专家经验评价进行两指标之间的主观比较;
步骤五三、确定选项和选项分值,对每个评价指标设定4个选项,得出判断系数矩阵,计算出权重并赋予分值。随后,对选项判断矩阵用AHP层次分析法计算出权重。然后将指标选项中得分最高的选项依次设定为A、B、C、D选项,总分为100分,根据上述权重计算出每个选项的分值。在此基础上,即可根据各家国企的数据分别对指标选项进行选择,得出最终的评分。
步骤五四、建立一致性检验,判断矩阵的一致性,CRtest包调用weight函数,CI是一致性指标,CR是一致性比率,RI是随机一致性指标,使得最终 CR<0.10才能通过一致性检验。
步骤五五、对于最终评分结果进行核验,与主要评级机构的企业评级结果进行交叉比对,以验证评级结果的准确性。
实施例二
一种企业评分方法,包括:
采用通过一致性检验的实施例一所述的企业评分模型构建方法所构建的企业评分模型进行评分。
实施例三
一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如实施例二所述的企业评分方法。
实施例四
一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如实施例二所述的企业评分方法。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
机译: 企业保险介质管理系统,企业保险介质管理方法和企业保险介质管理程序
机译: 企业间运营商套餐服务的构建装置和企业间运营商套餐服务的构建方法
机译: 电子设备,零售网站评分模型的构建方法,系统和存储介质