技术领域
本发明涉及信贷风险评级领域,特别是涉及一种中小微企业信贷风险评级方法、一种中小微企业信贷风险评级装置、一种中小微企业信贷风险评级设备以及一种计算机可读存储介质。
背景技术
随着社会经济的发展,中小微企业已经是我国经济中的重要组成部分,对于就业、技术创新、市场经济收入有着重要的作用。加之近年来国家提出“大众创业,万众创新”的号召,使得中小微企业的数量逐渐壮大。
中小微企业具有特殊性,其企业数量众多,信贷市场需求庞大,与传统的产业的抵押品模式,风控模式及运营模式有所不同,中小微企业有生命周期较短,现金流不稳定,风险管理成本高,安全性较差、信息不对称性等问题导致信贷评估困难。
银行机构通常会更倾向于实力强的、现金流稳定,有往期的信贷记录且信誉高,风险低的企业进行放贷,但是这些企业通常都是往往信贷需求小。而在中小微企业中,信贷需求量大,但是中小微企业往往缺乏信贷的完整信息,例如因经营时间短、无往期信贷记录等原因,而会陷入大企业信贷需求小但是信贷风险评级容易,中小微企业信贷需求大但是信贷风险评级困难的局面。因此,中小微企业信贷风险评估问题亟须解决。
发明内容
本发明的目的是提供一种中小微企业信贷风险评级方法,可以实现对中小微企业进行信贷风险评级;本发明还提供了一种中小微企业信贷风险评级装置、一种中小微企业信贷风险评级设备以及一种计算机可读存储介质,可以实现对中小微企业进行信贷风险评级。
为解决上述技术问题,本发明提供一种中小微企业信贷风险评级方法,包括:
获取目标企业的发票信息;所述目标企业包括已评级企业和未评级企业,所述已评级企业对应的发票信息包括对应已评级企业的信誉评级;
根据所述发票信息计算信贷特征信息;
对所述信贷特征信息进行交叉衍生,以生成特征矩阵;
根据所述信誉评级生成先验隶属度矩阵;
调用半监督模糊聚类模型,根据所述特征矩阵以及所述先验隶属度矩阵,生成各个所述未评级企业对应的信誉评级。
可选的,所述信贷特征信息包括以下任意组合:
销项总金额、进项总金额、销项单数、进项单数、发票数、有效发票率、货源安全性、进项平稳性、销项平稳性。
可选的,在所述根据所述发票信息计算信贷特征信息之后,还包括:
对所述信贷特征信息进行归一化;
所述对所述信贷特征信息进行交叉衍生,以生成特征矩阵包括:
对进行归一化后的所述信贷特征信息进行交叉衍生,以生成特征矩阵。
可选的,对所述信贷特征信息进行交叉衍生,以生成特征矩阵包括:
对所述信贷特征信息进行交叉衍生得到全部待使用特征信息;
调用特征选择模型从全部所述待使用特征信息中选取可用特征信息;
根据所述可用特征信息生成所述特征矩阵。
可选的,所述特征选择模型为费雪得分模型或拉普拉斯得分模型。
可选的,所述半监督模糊聚类模型为SFCM模型。
本发明还提供了一种中小微企业信贷风险评级装置,包括:
获取模块,用于获取目标企业的发票信息;所述目标企业包括已评级企业和未评级企业,所述已评级企业对应的发票信息包括对应已评级企业的信誉评级;
信贷特征信息计算模块,用于根据所述发票信息计算信贷特征信息;
交叉衍生模块,用于对所述信贷特征信息进行交叉衍生,以生成特征矩阵;
先验隶属度矩阵生成模块,用于根据所述信誉评级生成先验隶属度矩阵;
评级模块,用于调用半监督模糊聚类模型,根据所述特征矩阵以及所述先验隶属度矩阵,生成各个所述未评级企业对应的信誉评级。
可选的,所述信贷特征信息包括以下任意组合:
销项总金额、进项总金额、销项单数、进项单数、发票数、有效发票率、货源安全性、进销项平稳性。
本发明还提供了一种中小微企业信贷风险评级设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如上述任意一项所述中小微企业信贷风险评级方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行以实现如上述任意一项所述中小微企业信贷风险评级方法的步骤。
本发明所提供的一种中小微企业信贷风险评级方法,包括获取目标企业的发票信息;目标企业包括已评级企业和未评级企业,已评级企业对应的发票信息包括对应已评级企业的信誉评级;根据发票信息计算信贷特征信息;对信贷特征信息进行交叉衍生,以生成特征矩阵;根据信誉评级生成先验隶属度矩阵;调用半监督模糊聚类模型,根据特征矩阵以及先验隶属度矩阵,生成各个未评级企业对应的信誉评级。
通过发票信息构建信贷特征信息,并通过交叉衍生升维,可以使得特征矩阵中信息更加有效;同时结合先验隶属度矩阵,可以有效利用已有的信誉等级信息,通过半监督模糊聚类模型可以实现对经营时间较短、无信贷记录的企业进行信誉等级评估。
本发明还提供了一种中小微企业信贷风险评级装置、一种中小微企业信贷风险评级设备以及一种计算机可读存储介质,同样具有上述有益效果,在此不再进行赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种中小微企业信贷风险评级方法的流程图;
图2为本发明实施例所提供的一种具体的中小微企业信贷风险评级方法的流程图;
图3为本发明实施例所提供的一种中小微企业信贷风险评级装置的结构框图;
图4为本发明实施例所提供的一种中小微企业信贷风险评级设备的结构框图。
具体实施方式
本发明的核心是提供一种中小微企业信贷风险评级方法。在现有技术中,中小微企业有生命周期较短,现金流不稳定,风险管理成本高,安全性较差、信息不对称性等问题导致信贷评估困难。银行机构通常会更倾向于实力强的、现金流稳定,有往期的信贷记录且信誉高,风险低的企业进行放贷,但是这些企业通常都是往往信贷需求小。而在中小微企业中,信贷需求量大,但是中小微企业往往缺乏信贷的完整信息,例如因经营时间短、无往期信贷记录等原因,而会陷入大企业信贷需求小但是信贷风险评级容易,中小微企业信贷需求大但是信贷风险评级困难的局面。
而本发明所提供的一种中小微企业信贷风险评级方法,包括获取目标企业的发票信息;目标企业包括已评级企业和未评级企业,已评级企业对应的发票信息包括对应已评级企业的信誉评级;根据发票信息计算信贷特征信息;对信贷特征信息进行交叉衍生,以生成特征矩阵;根据信誉评级生成先验隶属度矩阵;调用半监督模糊聚类模型,根据特征矩阵以及先验隶属度矩阵,生成各个未评级企业对应的信誉评级。
通过发票信息构建信贷特征信息,并通过交叉衍生升维,可以使得特征矩阵中信息更加有效;同时结合先验隶属度矩阵,可以有效利用已有的信誉等级信息,通过半监督模糊聚类模型可以实现对经营时间较短、无信贷记录的企业进行信誉等级评估。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的一种中小微企业信贷风险评级方法的流程图。
参见图1,在本发明实施例中,中小微企业信贷风险评级方法包括:
S101:获取目标企业的发票信息。
在本发明实施例中,所述目标企业包括已评级企业和未评级企业,所述已评级企业对应的发票信息包括对应已评级企业的信誉评级。在本步骤中获取的发票信息包括进项发票信息以及销项发票信息,其中进项发票信息如下表1所示:
表1.进项发票信息
与上述表1相类似,销项发票信息如下表2所示:
表2.销项发票信息
上述进项发票即企业进货(购买产品)时销售方为其开具的发票;销项发票即企业销售产品时为购货方开具的发票。上述发票信息中的发票状态可以包括有效发票、作废发票、负数发票等等,其中有效发票为正常的交易活动开具的发票;作废发票为在为交易活动开具发票后,因故取消了该项交易,使作废的发票;负数发票为在为交易活动开具发票后,企业已入账记税,之后购方因故发生退货并退款,此时需开具的负数发票。
需要说明的是,上述目标企业包括已评级企业和未评级企业,其中已评级企业是已经经过银行进行评级的企业,相对应的,未评级企业是还未经过银行进行评级的企业。因此上述发票信息还会包括有已评级企业对应的信誉评级,该信誉评级为银行内部根据企业的实际情况人工评定的等级,通常情况下信誉评级包括A、B、C、D,银行对信誉评级为D的企业原则上不予放贷。
具体的,在本步骤中获取的应用于后续生成特征矩阵的发票信息可以如下表3所示,表3中具体内容仅仅做举例说明使用:
表3.发票信息
S102:根据发票信息计算信贷特征信息。
上述信贷特征信息需要通过上述发票信息计算得到,具体的,在本发明实施例中所述信贷特征信息包括以下任意组合:销项总金额、进项总金额、销项单数、进项单数、发票数、有效发票率、货源安全性、进项平稳性、销项平稳性。当然,通常情况下会使用上述全部信贷特征信息进行后续的计算,有关信贷特征信息的具体种类可以根据实际情况自行设定,在此不做具体限定。
上述进项总金额为单个企业的进项总金额,销项总金额为单个企业的销项总金额,进项单数为单个企业的进项单数,销项单数为单个企业的销项单数,发票数为单个企业的发票总数,有效发票率为单个企业有效发票占发票总数的比例。
对于货源安全性,由于对规模小,企业经营分散,竞争力不强的中小微企业,其发展易受行业周期以及宏观经济形势影响,银行可通过评价企业面临突发情况时货源安全、可靠与否,判断营收是否正常运行。而在本发明实施例中,可以根据企业从多加供货商获取的发票数目计算货源安全性,该货源安全性计算方式如下:
首先需要统计该企业对应各个供货商的进项发票数;之后计算多个进项发票数的方差;最后将该方差的倒数作为货源安全性数值,其数值越大表示该企业的供应链越安全。
上述进项平稳性以及销项平稳性可以表示每家企业每天发票总额度增长速度,其中进项平稳性计算表达式如下:
其中a
S103:对信贷特征信息进行交叉衍生,以生成特征矩阵。
在本步骤之前,通常需要对上述各个信贷特征信息归一化,在本发明实施例中可以基于min-max标准化,也称为离差标准化,其标准化公式如下:
其中x
在本步骤中,通常具体是对进行归一化后的所述信贷特征信息进行交叉衍生,以生成特征矩阵。交叉衍生相当于增加了一部分由原来两个特征相乘组合起来的数值,例如,在交叉衍生之前信贷特征信息为x
S104:根据信誉评级生成先验隶属度矩阵。
由于上述目标企业中一部分企业是有信誉评级的,而信誉评级分为ABCD四类,因此根据已有的信誉评级可以生成先验隶属度矩阵,该矩阵的一列或一行对应ABCD四个评级,对于已评级企业其对应评级通常为1,其他评级通常为0;对于未评级企业其先验隶属度为(0,0,0,0),从而可以构建对应全部目标企业的先验隶属度矩阵
需要说明的是,本步骤与上述S102至S103没有具体的先后顺序,通常情况下本步骤与上述S102至S103并行执行。
S105:调用半监督模糊聚类模型,根据特征矩阵以及先验隶属度矩阵,生成各个未评级企业对应的信誉评级。
上述半监督模糊聚类模型即基于半监督模糊聚类算法所生成的模型,半监督模糊聚类模型可以通过半监督模糊聚类算法,根据所述特征矩阵以及所述先验隶属度矩阵,生成各个所述未评级企业对应的信誉评级,即计算各个未评级企业对信誉评级ABCD的隶属度,从而实现对经营时间较短、无信贷记录的企业进行信誉等级评估。有关半监督模糊聚类模型的具体内容将在下述发明实施例中做详细介绍,在此不再进行赘述。
本发明实施例所提供的一种中小微企业信贷风险评级方法,包括获取目标企业的发票信息;目标企业包括已评级企业和未评级企业,已评级企业对应的发票信息包括对应已评级企业的信誉评级;根据发票信息计算信贷特征信息;对信贷特征信息进行交叉衍生,以生成特征矩阵;根据信誉评级生成先验隶属度矩阵;调用半监督模糊聚类模型,根据特征矩阵以及先验隶属度矩阵,生成各个未评级企业对应的信誉评级。
通过发票信息构建信贷特征信息,并通过交叉衍生升维,可以使得特征矩阵中信息更加有效;同时结合先验隶属度矩阵,可以有效利用已有的信誉等级信息,通过半监督模糊聚类模型可以实现对经营时间较短、无信贷记录的企业进行信誉等级评估。
有关本发明所提供的一种中小微企业信贷风险评级方法的具体内容将在下述发明实施例中做详细介绍。
请参考图2,图2为本发明实施例所提供的一种具体的中小微企业信贷风险评级方法的流程图。
参见图2,在本发明实施例中,中小微企业信贷风险评级方法包括:
S201:获取目标企业的发票信息。
S202:根据发票信息计算信贷特征信息。
上述S201至S202与上述发明实施例中S101至S102基本一致,详细内容请参考上述发明实施例,在此不再进行赘述。
S203:对信贷特征信息进行交叉衍生得到全部待使用特征信息。
在本步骤中,该待使用特征信息即交叉衍生后,得到的形如x
S204:调用特征选择模型从全部待使用特征信息中选取可用特征信息。
特征选择模型即根据特征选择方法所构建的模型,在本步骤中会通过特征选择模型对全部待使用特征信息进行筛选,从待使用特征信息中选取可用特征信息。具体的,上述特征选择模型可以为费雪得分模型或拉普拉斯得分模型,其中费雪得分模型即FisherScore算法所对应的模型,拉普拉斯得分模型即Laplacian score算法所对应的模型,这两种算法均能够得到每个待使用特征信息的重要程度,其具体为对分类标签的影响程度,该重要程度通常以大于0的数来表示,其数值越大说明重要程度越高。在本步骤中通常会保留预设数量个重要程度较高的待使用特征信息作为可用特征信息。有关Fisher Score算法与Laplacian score算法的具体内容可以参考现有技术,在此不再进行赘述。
S205:根据可用特征信息生成特征矩阵。
在本步骤中,会根据上述选取的可用特征信息生成特征矩阵,以排除特征矩阵内的冗余特征,避免受共线性的影响,让信息更有效。本步骤的其余内容已在上述发明实施例中做详细介绍,在此不再进行赘述。
S206:根据信誉评级生成先验隶属度矩阵。
本步骤与上述发明实施例中S104基本一致,详细内容请参考上述发明实施例,在此不再进行赘述。
S207:调用半监督模糊聚类模型,根据特征矩阵以及先验隶属度矩阵,生成各个未评级企业对应的信誉评级。
在本发明实施例中,所述半监督模糊聚类模型可以具体为SFCM模型。SFCM(Semi-supervised Fuzzy C-means clustering)是一种半监督模糊聚类算法,其目标函数如下:
其中m(m>1)表示模糊程度,当m趋向1,半监督模糊聚类(SFCM)接近传统的硬聚类(HCM)。||·||代表欧氏距离,u
m为加权指数,它是一个可以调整的参数,通常为2。然后可以得到隶属度和聚类中心的迭代公式:
其中α是预定的抑制系数。当半监督模糊聚类模型输出结果为Max(u
本发明实施例所提供的一种中小微企业信贷风险评级方法,过发票信息构建信贷特征信息,并通过交叉衍生升维,可以使得特征矩阵中信息更加有效;同时结合先验隶属度矩阵,可以有效利用已有的信誉等级信息,通过半监督模糊聚类模型可以实现对经营时间较短、无信贷记录的企业进行信誉等级评估。
下面对本发明实施例所提供的一种中小微企业信贷风险评级装置进行介绍,下文描述的中小微企业信贷风险评级装置与上文描述的中小微企业信贷风险评级方法可相互对应参照。
请参考图3,图3为本发明实施例所提供的一种中小微企业信贷风险评级装置的结构框图。参照图3,中小微企业信贷风险评级装置可以包括:
获取模块100,用于获取目标企业的发票信息;所述目标企业包括已评级企业和未评级企业,所述已评级企业对应的发票信息包括对应已评级企业的信誉评级。
信贷特征信息计算模块200,用于根据所述发票信息计算信贷特征信息。
交叉衍生模块300,用于对所述信贷特征信息进行交叉衍生,以生成特征矩阵。
先验隶属度矩阵生成模块400,用于根据所述信誉评级生成先验隶属度矩阵。
评级模块500,用于调用半监督模糊聚类模型,根据所述特征矩阵以及所述先验隶属度矩阵,生成各个所述未评级企业对应的信誉评级。
作为优选的,在本发明实施例中,所述信贷特征信息包括以下任意组合:
销项总金额、进项总金额、销项单数、进项单数、发票数、有效发票率、货源安全性、进销项平稳性。
作为优选的,在本发明实施例中,还包括:
归一化模块,用于对所述信贷特征信息进行归一化。
交叉衍生模块300具体用于:
对进行归一化后的所述信贷特征信息进行交叉衍生,以生成特征矩阵。
作为优选的,在本发明实施例中,交叉衍生模块300包括:
交叉衍生单元,用于对所述信贷特征信息进行交叉衍生得到全部待使用特征信息。
特征选择单元,用于调用特征选择模型从全部所述待使用特征信息中选取可用特征信息。
矩阵生成单元,用于根据所述可用特征信息生成所述特征矩阵。
作为优选的,在本发明实施例中,所述特征选择模型为费雪得分模型或拉普拉斯得分模型。
作为优选的,在本发明实施例中,所述半监督模糊聚类模型为SFCM模型。
本实施例的中小微企业信贷风险评级装置用于实现前述的中小微企业信贷风险评级方法,因此中小微企业信贷风险评级装置中的具体实施方式可见前文中的中小微企业信贷风险评级方法的实施例部分,例如,获取模块100,信贷特征信息计算模块200,交叉衍生模块300,先验隶属度矩阵生成模块400,评级模块500分别用于实现上述中小微企业信贷风险评级方法中步骤S101与S105,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
下面对本发明实施例提供的一种中小微企业信贷风险评级设备进行介绍,下文描述的中小微企业信贷风险评级设备与上文描述的中小微企业信贷风险评级方法以及中小微企业信贷风险评级装置可相互对应参照。
请参考图4,图4为本发明实施例所提供的一种中小微企业信贷风险评级设备的结构框图。
参照图4,该中小微企业信贷风险评级设备可以包括处理器11和存储器12。
所述存储器12用于存储计算机程序;所述处理器11用于执行所述计算机程序时实现上述发明实施例中所述的中小微企业信贷风险评级方法的具体内容。
本实施例的中小微企业信贷风险评级设备中处理器11用于安装上述发明实施例中所述的中小微企业信贷风险评级装置,同时处理器11与存储器12相结合可以实现上述任一发明实施例中所述的中小微企业信贷风险评级方法。因此中小微企业信贷风险评级设备中的具体实施方式可见前文中的中小微企业信贷风险评级方法的实施例部分,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一发明实施例中所介绍的一种中小微企业信贷风险评级方法。其余内容可以参照现有技术,在此不再进行展开描述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种中小微企业信贷风险评级方法、一种中小微企业信贷风险评级装置、一种中小微企业信贷风险评级设备以及一种计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
机译: 聚核苷酸和聚核苷酸分离的植物细胞,转基因植物,DNA构建体,木材,木浆,由木材转化的植物的生产方法,木浆,修饰植物表型的方法,相关性基因在两个不同样品中的表达。在一个或多个基因在植物中的基因表达水平上具有植物的表型,并且基因表达与形成反应木材的倾向相关。一种或多种基因的表达,微结膜,检测样品中一种或多种基因的方法。样品和试剂盒中一种或多种基因编码的一种或多种核酸序列。
机译: 同位素富集的化合物,药物组合物,在受试者中治疗,预防或减轻基础,肥大细胞相关或肥大细胞相关嗜酸性粒细胞相关的ccr3相关疾病,病症或病状的一种或多种症状的方法,治疗方法,预防或减轻受试者中炎性疾病的一种或多种症状和调节ccr3活性的方法。
机译: 肽,规定的肽,成分,药物成分,瓶,消毒溶液,微生物的生长抑制,复制或感染的方法,细菌生长的抑制方法,细菌生长的抑制作用,治疗由微生物感染引起或与之有关的疾病的预防,疾病的抑制方法,一种细菌治疗方法的治疗和一种或多种细菌引起的疾病的治疗感染,预防由细菌感染引起的疾病或与之相关的疾病的方法,在受试者体内抑制病毒复制的方法以及对由细菌引起或与之相关的疾病的治疗在主题中,一种预防由对象中的病毒感染引起或与之相关的疾病的方法,一种用于对INA进行消毒的方法