首页> 中国专利> 一种企业违约预测方法、装置、介质及电子设备

一种企业违约预测方法、装置、介质及电子设备

摘要

本申请实施例公开了一种企业违约预测方法、装置、介质及电子设备。涉及人工智能技术领域。所述方法包括:获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。执行本方案,可以提高企业违约预测的准确率。

著录项

  • 公开/公告号CN112990946A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 建信金融科技有限责任公司;

    申请/专利号CN202110349132.5

  • 发明设计人 马宁亚;王雪;

    申请日2021-03-31

  • 分类号G06Q30/00(20120101);G06Q10/04(20120101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人孟金喆

  • 地址 200120 上海市浦东新区中国(上海)自由贸易试验区银城路99号12层、15层

  • 入库时间 2023-06-19 11:29:13

说明书

技术领域

本申请实施例涉及人工智能技术领域,尤其涉及一种企业违约预测方法、装置、介质及电子设备。

背景技术

企业违约是指企业存在不符合法律规定的行为,近年来高发的企业违约现象给相关金融机构带来了严重的经济损失。因此,对企业违约概率进行预测,并针对存在高违约概率的企业采取相应的管理措施具有重要意义。

目前金融机构主要利用评分卡、黑白灰名单或者逻辑回归等方法,对目标企业的工商信息、税务信息和财务信息等企业自身信息进行处理,实现对企业的违约概率的预测。而实际金融场景下企业关系类型繁多且差异性大,仅依靠企业自身信息是无法有效的表示企业之间复杂的关联关系,这就使得上述企业违约方法的企业违约预测存在预测准确度低的问题。

发明内容

本申请实施例提供一种企业违约预测方法、装置、介质及电子设备,可以达到提高企业违约准确率的目的。

第一方面,本申请实施例提供了一种企业违约预测方法,所述方法包括:

获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;

根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;

根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;

将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

第二方面,本申请实施例提供了一种企业违约预测装置,所述装置包括:

企业信用信息获取模块,用于获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;

信用时序特征确定模块,用于根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;

信用结构特征确定模块,用于根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;

特征融合模块,用于将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的企业违约预测方法。

第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的企业违约预测方法。

本申请实施例提供的技术方案,通过获取目标企业的企业信用信息,从企业信用信息抽取目标企业的信用时序特征和信用结构特征,再将信用时序特征和信用结构进行特征融合得到融合特征,根据融合特征确定目标企业的违约概率。本申请实施例综合考虑了目标企业自身发展阶段动态变化的特征,目标企业、关联企业和目标企业管理者关联关系网络结构特征,结合多维度企业信用信息,全方位多角度地对目标企业的违约概率进行预测,提高了企业违约概率预测的准确度。

附图说明

图1是本申请实施例一提供的一种企业违约预测方法的流程图;

图2是本申请实施例二提供的另一种企业违约预测方法的流程图;

图3是本申请实施例三提供的又一种企业违约预测方法的流程图;

图4是本申请实施例四提供的又一种企业违约预测方法的流程图;

图5是本申请实施例五提供的又一种企业违约预测方法的流程图;

图6是本申请实施例六提供的一种企业违约预测装置的结构示意图;

图7是本申请实施例八提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1是本申请实施例一提供的一种企业违约预测方法的流程图,本实施例可适用于对企业违约行为进行预测的情况。该方法可以由本申请实施例所提供的企业违约预测装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于运行此系统的电子设备中。

如图1所示,所述企业违约预测方法包括:

S110、获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息。

其中,企业信用信息是指与企业违约行为直接相关或者间接相关的信息。企业信用信息的具体种类可以根据违约预测场景的业务先验经验确定。企业信用信息不仅包括企业层面,还包括个人层面。企业管理者信息属于个人层面的信息,企业管理者是企业的管理人员如企业的法人或者高管,企业管理者的决策直接影响企业的运营,对于企业违约行为的预测有重要意义。示例性的,企业管理者信息包括:年龄、性别、学历、职业,职位和工作经历。

企业财务信用信息和社会信用信息所属于公司层面的信息。其中,在判断和预测企业是否存在违约行为的情况下,企业财务信用是最重要的数据。在一个可选的实施例中,所述企业财务信用信息包括银行信用信息、商业信用信息、企业资质信息、关联信用信息和企业财务信息中的至少一种。示例性的,银行信用信息包括贷款和还款记录;商业信用信息包括:赊销信用额度、商账还款和合同履约记录;企业资质信息包括注册商标、产品准产证登记、质量认证记录、机构名称、机构代码、机构性质、注册地址、经营地址和注册资本等信息。关联信用信息包括担保、质押、抵押记录等;企业财务信息包括资产负债、利润分配、现金流量、财务警示、财务审计记录等。

其中,社会信用信息是指涉及企业信用的社会舆论。在一个可选的实施例中,社会信用信息包括:公众信用信息或者社会舆情信息。示例性的,公众信用信息包括企业涉案、处罚、不良社会信用记录;社会舆情信息包括社会媒体以及社会公众对企业的评述。

由于目标企业的企业信信用信息的来源不同,企业信用信息中各数据项之间可能存在数据冗余、数据缺损或者格式不统一的问题,为便于后续的数据处理操作。在一个可选的实施例中,在获取目标企业的企业信用信息以后,所述方法还包括:对所述企业信用信息进行数据清洗;其中,所述数据清洗包括以下至少一项:异常值处理、拆并表、同信息多来源数据整合、数据截断、规范化、标准化和中性化。

其中,异常值处理采用的方法包括:特定值填充、均值/众数填充、总体分布填充、样条插值等填充方法以及样本和变量过滤方法。

S120、根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征。

目标时间段内企业财务信用信息和社会信用信息,是指目标企业的历史的企业财务信用信息和社会信用信息。其中,目标时间段是本领域技术人员根据实际情况确定的,在这里不做限定。示例性的,目标时间段可以为就几个月,或者是几年。

从目标时间段原始的企业财务信用信息和社会信用信息中剔除无效信息,抽取对企业违约预测有效的信息作为目标企业的信用时序特征。其中,信用时序特征是表示目标企业自身发展阶段动态变化的特征,反映的是企业运营轨迹动态。

S130、根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的。

其中,关联企业是指与目标企业关联的企业。具体的,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的。示例性,与目标企业存在担保或者质押关系,或者和目标企业存在竞争关系的企业,目标企业的供应商等均为关联企业。类比目标企业信用信息种类,关联企业信息同样可以包括:企业管理者信息、企业财务信用信息和社会信用信息。

根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征。其中,目标企业的信用结构特征表示的是关联企业和目标企业管理者与目标企业之间的关联关系,不同于信用时序特征,目标企业的信用结构特征反映的是相对静态的目标企业、关联企业和目标企业管理者关联关系网络结构特征。

S140、将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

从时间维度上,信用时序特征为目标企业自身的纵向时间序列特征。信用结构为横向的目标企业关联关系网络结构特征。将信用时序特征和信用结构特征进行特征融合,利用融合特征确定目标企业的违约概率。这样做,综合考虑了不同维度的特征数据,全方位多角度地实现目标企业的违约概率预测。

本申请实施例提供的技术方案,通过获取目标企业的企业信用信息,从企业信用信息抽取目标企业的信用时序特征和信用结构特征,再将信用时序特征和信用结构进行特征融合得到融合特征,根据融合特征确定目标企业的违约概率。本申请实施例综合考虑了目标企业自身发展阶段动态变化的特征,目标企业、关联企业和目标企业管理者关联关系网络结构特征,结合多维度企业信用信息,全方位多角度地对目标企业的违约概率进行预测,提高了企业违约概率预测的准确度。

实施例二

图2是本申请实施例二提供的另一种企业违约预测方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。具体优化为,根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征,包括:利用时序特征提取模型提取目标时间窗口中所述企业财务信用信息和所述社会信用信息的单位信用时序特征;利用自注意力机制确定所述单位信用时序特征的注意力权重;根据所述单位信用时序特征和所述注意力权重确定所述目标企业的信用时序特征。

如图2所示,所述企业违约预测方法包括:

S210、获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息。

S220、利用时序特征提取模型提取目标时间窗口中所述企业财务信用信息和所述社会信用信息的单位信用时序特征。

其中,企业财务信用信息和所述社会信用信息为带有时间维度信息的数据,具体为目标时间段内所述企业财务信用信息和所述社会信用信息。

其中,时序特征提取模型是用于提取目标企业的企业信用信息中时序特征,具有时序信息处理能力的模型。可选的,时序特征提取模型可以为时间卷积(TemporalConvolutional Network)、Transformer时序预测和LSTM(Long-Short Term Memory,长短期记忆人工神经网络)。优选的,LSTM的时序信息提取完整度较好。

其中,目标时间窗口是指时序特征提取模型进行企业财务信用信息和社会信用信息处理时的数据处理单位。目标时间窗口是相关技术人员根据时序特征提取模型的处理能力确定的,在这里不作限定。时序特征提取模型通过滑动目标时间窗口完成全部企业财务信用信息和社会信用信息的信用时序特征提取。

时序特征提取模型对目标时间窗口内数据进行特征提取,对应提取到的特征数据为单位信用时序特征。

S230、利用自注意力机制确定所述单位信用时序特征的注意力权重。

由于,每个单位信用时序特征均对应着不同时段的企业财务信用信息和社会信用信息,不同历史时刻的特征数据对预测目标企业的违约概率贡献度不同。因此,向不同时刻的单位信用时序特征赋予不同的权值,可以使得预测结果更准确。一般而言,距离当前时刻越近,对于预测目标企业违约行为越有效,对应的单位信用时序特征的权重也应该越大。

利用自注意力机制确定单位信用时序特征的注意力权重,可以快速提取稀疏数据的重要特征,自注意力机制计算的是单位信用时序特征内部之间的权重,其减少了对外部信息的依赖,可以有效地捕捉单位信用时序特征的内部相关性,聚焦对目前目标企业运营状态更有效的历史信息。

S240、根据所述单位信用时序特征和所述注意力权重确定所述目标企业的信用时序特征。

将单位信用时序特征赋予对应的注意力权重,具体的,可以将注意力权重与对应的单位信用时序特征进行乘法计算,将得到的计算结果作为目标企业的信用时序特征。

S250、根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的。

S260、将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

本申请实施例所提供的技术方案,通过利用时序特征提取模型提取目标时间窗口中企业财务信用信息和社会信用信息的单位信用时序特征,并利用自注意力机制确定单位信用时序特征的注意力权重,然后根据单位信用时序特征和注意力权重确定目标企业的信用时序特征,本申请实施例考虑了目标时间段内不同历史时刻的企业财务信用信息和社会信用信息,对目标企业违约预测的贡献度,通过引入了自注意力机制,捕捉单位信用时序特征的内部相关性,提高了企业违约概率预测的准确度。

实施例三

图3是本申请实施例三提供的又一种企业违约预测方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。具体优化为,根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征,包括:根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱;根据所述知识图谱中的关联关系和节点信息,确定所述目标企业的信用结构特征。

如图3所示,所述企业违约预测方法包括:

S310、获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息。

S320、根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征。

S330、根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱。

其中,知识图谱本质上是一种语义网络,是基于图的数据结构,以图的方式存储知识并返回经过加工和推理的知识。它由“节点”和“边”组成,节点表示现实世界中的“实体”,边表示实体之间的“关系”。知识图谱可以有效、最直观地表达出实体间的关系。也就是,把大量不同种类的信息连接在一起而得到一个关系网络,为人们提供了从“关系”的角度分析问题的能力。

关联企业和企业管理者均是与目标企业存在关联关系的企业和个人,关联企业信息和企业管理者信息则包括着关联企业和企业管理者具体的关系,如供应商关系、客户关系、存在大额资金往来关系、实控人、法人、配偶等关联关系。根据关联企业信息和企业管理者信息构建目标企业的知识图谱,有效、最直观地表达关联企业、企业管理者和目标企业的关系。

在一个可选的实施例中,根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱,包括:将所述关联企业、所述目标企业和所述目标企业的企业管理者作为所述知识图谱的节点,并根据所述企业信用信息确定节点对应的属性;根据所述关联企业与所述目标企业的关联关系和所述企业管理者与所述目标企业的关联关系确定所述知识图谱的边;其中,所述边用于连接所述节点。

关联企业、目标企业和目标企业的企业管理者为实体,对应为知识图谱中的节点。值得注意的是,关联企业和目标企业同属于企业类,目标企业的企业管理者属于个人类,知识图谱中节点之间的关系也有多种不同的形式,由关联企业、目标企业和目标企业的企业管理者构成的知识图谱为异质图。节点的属性根据企业信用信息确定,对于企业管理者属性可以包括学历、年龄和联系方式等;对于关联企业和目标企业属性可以包括成立时间、机构代码、机构性质、注册地址和经营地址等信息。

根据关联企业与目标企业的关联关系和企业管理者与目标企业的关联关系确定知识图谱的边,企业之间关联关系包括:担保和资金往来等关系,企业和个人之间包括:实控人和法人等关系。

在构建知识图谱以后,将知识图谱中的节点、边和属性以起点、边和终点的三元组形式导入图数据库进行存储。或者使用表结构的方式,存储至关系型数据库。

S340、根据所述知识图谱中的关联关系和节点信息,确定所述目标企业的信用结构特征。

知识图谱作为基于图的数据结构,可以通过图卷积神经网络从知识图谱中提取目标企业的信用结构特征。

S350、将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

本申请实施例所提供的技术方案,通过根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱,再根据知识图谱中的关联关系和节点信息,确定目标企业的信用结构特征,将信用结构特征和信用时序特征进行特征融合,根融合特征确定目标企业的违约概率。本申请通过构建包括个人和企业的异质图,有效地表达出了不同种类实体间的关系,提高了企业违约概率预测的准确度。

实施例四

图4是本申请实施例四提供的又一种企业违约预测方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。具体优化为,根据所述知识图谱中的关联关系和节点信息,确定所述目标企业的信用结构特征,包括:根据所述知识图谱中的关联关系和节点信息,确定所述知识图谱各关联关系下知识图谱的结构特征;利用注意力机制计算不同关联关系下所述结构特征间的关系权重系数;根据所述结构特征和所述关系权重系数,确定所述目标企业的信用结构特征。

如图4所示,所述企业违约预测方法包括:

S410、获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息。

S420、根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征。

S430、根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱。

S440、根据所述知识图谱中的关联关系和节点信息,确定所述知识图谱各关联关系下知识图谱的结构特征。

其中,关联关系是指关联企业与目标企业的关系,企业管理者和目标企业的关联关系。不同类型节点之间的关联关系存在差异,相同类型的节点之间也会存在多种不同的关联关系。

考虑到知识图谱中不同类型节点和节点间不同关联关系的差异,为了简化目标企业的结构特征的确定过程,由于在关联关系确定后,异质图即可转化为同质图,则可以相对简单的同质图的处理方法确定不同的关联关系下知识图谱的结构特征。具体的,以图卷积的方式利用不同关联关系下的变换矩阵将知识图谱投影到一个公共空间中,得到知识图谱中个关联关系下知识图谱中节点的向量表示。

在关联关系确定的情况下,在一个可选的实施例中,根据所述知识图谱中的关联关系和节点信息,确定所述知识图谱各关联关系下知识图谱的结构特征,包括:利用所述结构特征提取模块提取所述知识图谱中目标关联关系下所述知识图谱的初始结构特征;利用注意力机制计算所述知识图谱中节点间的相关权重系数;根据所述相关权重系数和所述初始结构特征,确定所述知识图谱在所述目标关联关系下的结构特征。

其中,结构特征提取模块是指具备图结构处理能力的模型,具体由相关技术人员根据实际情况确定。可选的,结构特征提取模块可以为HGAT或者异构Node2vec。优选HGAT(Heterogeneous Graph Attention Network,异构图形注意力网络),HGAT对于图结构信息的学习更充分。

利用所述结构特征提取模块提取所述知识图谱中目标关联关系下知识图谱的初始结构特征。其中,目标关联关系为知识图谱所包括关联关系中的任意一种。在目标关联关系确定以后,知识图谱中各节点的连接关系也相应确定。初始结构特征即为由结构特征提取模块在目标关联关系下,得到的未经其他处理的知识图谱中各节点的向量表示。

知识图谱中包括多个节点分别对应不同的企业和个人。由于节点对应的属性差异,使得不同节点对企业违约概率的进行预测时重要程度存在差异。在节点层级利用注意力机制,计算节点之间的相关权重系数,由于相关权重系数和初始结构特征均与节点相关。将相关权重系数和赋予对应的初始结构特征,得到确定知识图谱在目标关联关系下的结构特征。

在一个可选的实施例中,如果知识图谱中数据发生变化,如新增节点,或者节点之间的边发生变化时,采用同样的图卷积的方式对节点向量进行局部更新。

S450、利用注意力机制计算不同关联关系下所述结构特征间的关系权重系数。

不同关联关系对于企业违约预测的参考价值是不同的,直接反映企业运营状况的企业财务信用信息所包括的担保、质押、抵押和投资等关联关系,与其他关联关系相比参考价值更大,需要更多的关注。利用注意力机制计算不同关联关系下结构特征间的关系权重系数。根据对目标企业的不同影响程度,在关联关系层次,聚焦对目标企业更重要的关联关系。

在一个可选的实施例中,所述利用注意力机制计算所述知识图谱中节点间的相关权重系数,包括:利用所述自注意力机制分别计算所述目标节点和所述邻接节点的自注意力权重系数;其中,所述邻接节点是指与所述目标节点直接相连的节点;根据所述目标节点和所述邻接节点的自注意力权重系数计算相关权重系数。

目标节点为知识图谱中任一节点,邻接节点是指与目标节点直接相连的节点。根据目标节点和邻接节点的自注意力权重系数计算相关权重系数,具体的将目标节点和邻接节点的自注意力权重系数相乘,然后对乘积进行softmax归一化处理,得到的结果即为目标节点的相关权重系数,作为各点信息对企业违约预测的参考权重。

由于相关权重系数是根据目标节点和邻接节点的自注意权重系数得到的,在利用注意力机制计算节点的相关权重系数时,每次计算得到的结果可能存在差异,为了得到更准确的相关权重系数。在一个可选的实施例中,利用所述自注意力机制计算所述目标节点的自注意力权重系数,包括:至少两次利用所述自注意力机制计算所述目标节点的自注意力权重系数;将至少两次的自注意力权重系数的均值作为所述目标节点最终的自注意力权重系数。

S460、根据所述结构特征和所述关系权重系数,确定所述目标企业的信用结构特征。

在利用注意机制计算不同关联关系对应的关系权重系数可以得到关系权重系数矩阵,根据关系权重系数矩阵和结构特征向量进行计算,即可得到目标企业的信用结构特征。

S470、将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

本申请实施例所提供的技术方案,在确定目标企业的信用结构特征时,根据所述知识图谱中的关联关系和节点信息,确定知识图谱各关联关系下知识图谱的结构特征。利用注意力机制计算不同关联关系下所述结构特征间的关系权重系数。综合结构特征和关系权重系数,得到目标企业的信用结构特征。本申请在知识图谱的关联关系层次和节点层次引入注意力机制,聚焦对目标企业违约预测更重要信息,提高了企业违约预测的准确率。

实施例五

图5是本申请实施例五提供的又一种企业违约预测方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。具体优化为,将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率,包括:将所述信用时序特征和所述信用结构特征进行融合得到融合特征;将所述融合特征作为预先训练的违约预测模型的输入,以供所述违约预测模型输出所述目标企业的违约概率。

如图5所示,所述企业违约预测方法包括:

S510、获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息。

S520、根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征。

S530、根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的。

S540、将所述信用时序特征和所述信用结构特征进行融合得到融合特征。

将信用时序特征和信用结构特征进行特征融合,可以将信用时序特征和信用结构特征进行拼接,或者进行加权线性组合,或者采用门机制实现特征的融合,融合特征既包括目标企业自身的动态时序特征,还包括目标企业和关联企业以及管理人员的相关关系网络特征。可选的,融合特征为宽表形式。

S550、将所述融合特征作为预先训练的违约预测模型的输入,以供所述违约预测模型输出所述目标企业的违约概率。

将融合特征输入预先训练的违约预测模型,由违约预测模型输出目标企业的违约概率。

在一个可选的实施例中,在所述违约预测模型输出所述目标企业的违约概率之后,所述方法还包括:根据预设得分对应规则,将所述违约概率折算为所述目标企业的信用评分;根据所述目标企业的所述信用评分确定所述目标企业的违约等级,以供用户根据所述违约等级确定应对方案。

其中,预设得分对应规则是相关技术人员根据实际情况确定的,具体依据实际情况确定,在这里不做限定。根据预设得分对应规则,可以将违约概率折算为目标企业的信用评分。违约概率和信用评分成反比,违约概率越高信用评分越低。

将企业的信用评分划分为几个违约等级,企业的信用评分越高,企业的违约等级越低。在需要对大量企业进行违约预测时,可以根据企业的违约概率,确定企业的违约等级,再根据不同的违约等级,采取相应级别的预防措施。可以实现对高违约等级的企业进行重点管理,从而降低因企业违约造成的损失。

本申请实施例提供的技术方案,通过获取目标企业的企业信用信息,从企业信用信息抽取目标企业的信用时序特征和信用结构特征,再将信用时序特征和信用结构进行特征融合得到融合特征,根据融合特征确定目标企业的违约概率。本申请实施例综合考虑了目标企业自身发展阶段动态变化的特征,目标企业、关联企业和目标企业管理者关联关系网络结构特征,结合多维度企业信用信息,全方位多角度地对目标企业的违约概率进行预测,提高了企业违约概率预测的准确度。

实施例六

图6是本申请实施例六提供的一种企业违约预测装置,本实施例可适用于对企业违约行为进行预测的情况。所述装置可由软件和/或硬件实现,并可集成于智能终端等电子设备中。

如图6所示,该装置可以包括:企业信用信息获取模块610、信用时序特征确定模块620、信用结构特征确定模块630和特征融合模块640。

企业信用信息获取模块610,用于获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;

信用时序特征确定模块620,用于根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;

信用结构特征确定模块630,用于根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;

特征融合模块640,用于将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

本申请实施例提供的技术方案,通过获取目标企业的企业信用信息,从企业信用信息抽取目标企业的信用时序特征和信用结构特征,再将信用时序特征和信用结构进行特征融合得到融合特征,根据融合特征确定目标企业的违约概率。本申请实施例综合考虑了目标企业自身发展阶段动态变化的特征,目标企业、关联企业和目标企业管理者关联关系网络结构特征,结合多维度企业信用信息,全方位多角度地对目标企业的违约概率进行预测,提高了企业违约概率预测的准确度。

可选的,所述企业财务信用信息包括银行信用信息、商业信用信息、企业资质信息、关联信用信息和企业财务信息中的至少一种;所述社会信用信息包括:公众信用信息或者社会舆情信息。

可选的,信用时序特征确定模块620,包括:单位信用时序特征提取子模块,用于利用时序特征提取模型提取目标时间窗口中所述企业财务信用信息和所述社会信用信息的单位信用时序特征;注意力权重确定子模块,用于利用自注意力机制确定所述单位信用时序特征的注意力权重;信用时序特征确定子模块,用于根据所述单位信用时序特征和所述注意力权重确定所述目标企业的信用时序特征。

可选的,信用结构特征确定模块630,包括:目标企业知识图谱构建子模块,用于根据所述关联企业信息和所述企业管理者信息构建所述目标企业的知识图谱;信用结构特征确定子模块,用于根据所述知识图谱中的关联关系和节点信息,确定所述目标企业的信用结构特征。

可选的,目标企业知识图谱构建子模块,包括:知识图谱元素第一确定单元,用于将所述关联企业、所述目标企业和所述目标企业的企业管理者作为所述知识图谱的节点,并根据所述企业信用信息确定节点对应的属性;知识图谱元素第二确定单元,用于根据所述关联企业与所述目标企业的关联关系和所述企业管理者与所述目标企业的关联关系确定所述知识图谱的边;其中,所述边用于连接所述节点。

可选的,信用结构特征确定子模块,包括:知识图谱结构特征确定单元,用于根据所述知识图谱中的关联关系和节点信息,确定所述知识图谱各关联关系下知识图谱的结构特征;关系权重系数计算单元,用于利用注意力机制计算不同关联关系下所述结构特征间的关系权重系数;信用结构特征确定单元,用于根据所述结构特征和所述关系权重系数,确定所述目标企业的信用结构特征。

可选的,知识图谱结构特征确定单元,包括:知识图谱初始结构特征确定子单元,用于利用所述结构特征提取模块提取所述知识图谱中目标关联关系下所述知识图谱的初始结构特征;节点间相关权重系数确定子单元,用于利用注意力机制计算所述知识图谱中节点间的相关权重系数;目标关联关系下的结构特征确定子单元,用于根据所述相关权重系数和所述初始结构特征,确定所述知识图谱在所述目标关联关系下的结构特征。

可选的,节点间相关权重系数确定子单元,包括:自注意力权重系数计算子单元,用于利用所述自注意力机制分别计算所述目标节点和所述邻接节点的自注意力权重系数;其中,所述邻接节点是指与所述目标节点直接相连的节点;相关权重系数计算子单元,用于根据所述目标节点和所述邻接节点的自注意力权重系数计算相关权重系数。

可选的,相关权重系数计算子单元,包括目标节点自注意力权重系数计算子单元和邻接节点自注意力权重系数计算子单元。目标节点自注意力权重系数计算子单元,具体用于利用所述自注意力机制计算所述目标节点的自注意力权重系数。目标节点自注意力权重系数计算子单元,包括:目标节点自注意力权重系数第一计算子单元,用于至少两次利用所述自注意力机制计算所述目标节点的自注意力权重系数;目标节点自注意力权重系数第二计算子单元,用于将至少两次的自注意力权重系数的均值作为所述目标节点最终的自注意力权重系数。

可选的,特征融合模块640,包括:特征融合子模块,用于将所述信用时序特征和所述信用结构特征进行融合得到融合特征;目标企业违约概率输出模块,用于将所述融合特征作为预先训练的违约预测模型的输入,以供所述违约预测模型输出所述目标企业的违约概率。

可选的,所述装置还包括:目标企业信用评分确定模块,用于在所述违约预测模型输出所述目标企业的违约概率之后,根据预设得分对应规则,将所述违约概率折算为所述目标企业的信用评分;目标企业违约等级确定模块,用于根据所述目标企业的所述信用评分确定所述目标企业的违约等级,以供用户根据所述违约等级确定应对方案。

可选的,所述装置还包括:数据清洗模块,用于在获取目标企业的企业信用信息以后,对所述企业信用信息进行数据清洗;其中,所述数据清洗包括以下至少一项:异常值处理、拆并表、同信息多来源数据整合、数据截断、规范化、标准化和中性化。

本发明实施例所提供的一种企业违约预测装置可执行本发明任意实施例所提供的一种企业违约预测方法,具备执行一种企业违约预测方法相应的功能模块和有益效果。

实施例七

本申请实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种企业违约预测方法,该方法包括:

获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;

根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;

根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;

将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

存储介质是指任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同未知中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的企业违约预测操作,还可以执行本申请任意实施例所提供的企业违约预测方法中的相关操作。

实施例八

本申请实施例八提供了一种电子设备,该电子设备中可集成本申请实施例提供的企业违约预测装置,该电子设备可以是配置于系统内的,也可以是执行系统内的部分或者全部功能的设备。图7是本申请实施例八提供的一种电子设备的结构示意图。如图7所示,本实施例提供了一种电子设备700,其包括:一个或多个处理器720;存储装置710,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器720执行,使得所述一个或多个处理器720实现本申请实施例所提供的企业违约预测方法,该方法包括:

获取目标企业的企业信用信息;其中,所述企业信用信息包括企业管理者信息、企业财务信用信息和社会信用信息;

根据所述目标时间段内所述企业财务信用信息和所述社会信用信息,确定所述目标企业的信用时序特征;

根据所述企业管理者信息和关联企业信息,确定所述目标企业的信用结构特征;其中,关联企业是根据社会信用信息中企业关联关系和企业财务信用信息中企业关联关系确定的;

将所述信用时序特征和所述信用结构进行特征融合得到融合特征,根据所述融合特征确定所述目标企业的违约概率。

当然,本领域技术人员可以理解,处理器720还实现本申请任意实施例所提供的企业违约预测方法的技术方案。

图7显示的电子设备700仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示,该电子设备700包括处理器720、存储装置710、输入装置730和输出装置740;电子设备中处理器720的数量可以是一个或多个,图7中以一个处理器720为例;电子设备中的处理器720、存储装置710、输入装置730和输出装置740可以通过总线或其他方式连接,图7中以通过总线750连接为例。

存储装置710作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块单元,如本申请实施例中的企业违约预测方法对应的程序指令。

存储装置710可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置710可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置710可进一步包括相对于处理器720远程设置的存储器,这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置730可用于接收输入的数字、字符信息或语音信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏、扬声器等电子设备。

上述实施例中提供的企业违约预测装置、介质及电子设备可执行本申请任意实施例所提供的企业违约预测方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的企业违约预测方法。

注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号