首页> 中国专利> 逾期预测方法、装置、设备、介质及产品

逾期预测方法、装置、设备、介质及产品

摘要

本申请提供一种逾期预测方法、装置、设备、介质及产品,应用于人工智能领域和金融领域,也可以应用于除人工智能领域和金融领域之外的任意领域。该逾期预测装置包括:响应于针对目标用户的逾期预测请求,获得目标用户的待预测金融信息;待预测金融信息包括金融属性对应的金融数据;对金融属性进行属性扩展处理,获得金融属性对应的时段属性;根据金融属性和金融属性对应的时段属性,确定目标金融属性;基于目标金融属性,确定待预测金融信息对应的目标金融数据;将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。本申请的方法,提高了用户的逾期预测准确度。

著录项

  • 公开/公告号CN114676937A

    专利类型发明专利

  • 公开/公告日2022-06-28

    原文格式PDF

  • 申请/专利权人 中国工商银行股份有限公司;

    申请/专利号CN202210469109.4

  • 发明设计人 程鹏;白佳乐;任政;武文轩;

    申请日2022-04-29

  • 分类号G06Q10/04;G06Q40/02;G06N20/00;

  • 代理机构北京同立钧成知识产权代理有限公司;

  • 代理人臧建明;黄健

  • 地址 100140 北京市西城区复兴门内大街55号

  • 入库时间 2023-06-19 15:47:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-28

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及人工智能领域和金融领域,尤其涉及一种逾期预测方法、装置、设备、介质及产品。

背景技术

随着互联网金融技术的迅速发展,用户的贷款途径越来越多,为了降低金融风险,及时对用户的还款状况进行预测是目前一种较为常见的人工智能的应用领域。

相关技术中,首先可以基于用户的流水、存款等信息进行还款特征提取,然后利用统计学算法或者机器学习算法对用户的还款特征进行逾期结果预测,获得预测结果。预测结果可以包括逾期或者不逾期。但是,上述方案中逾期预测的准确度并不高,如何进行准确的逾期预测是目前亟待解决的技术问题。

发明内容

本申请提供一种预测模型训练、逾期预测方法、装置、设备、介质及产品,用以解决对用户的逾期预测的准确度并不高的技术问题。

第一方面,本申请提供一种逾期预测方法,包括:

响应于针对目标用户的逾期预测请求,获得目标用户的待预测金融信息;待预测金融信息包括金融属性对应的金融数据;

对金融属性进行属性扩展处理,获得金融属性对应的时段属性;

根据金融属性和金融属性对应的时段属性,确定目标金融属性;

基于目标金融属性,确定待预测金融信息对应的目标金融数据;

将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。

第二方面,本申请提供一种逾期预测装置,包括:

请求响应单元,用于响应于针对目标用户的逾期预测请求,获得目标用户的待预测金融信息;待预测金融信息包括金融属性对应的金融数据;

属性扩展单元,用于对金融属性进行属性扩展处理,获得金融属性对应的时段属性;

属性确定单元,用于根据金融属性和金融属性对应的时段属性,确定目标金融属性;

信息确定单元,用于基于目标金融属性,确定待预测金融信息对应的目标金融数据;

结果预测单元,用于将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。

第三方面,本申请提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;

存储器存储计算机执行指令;

处理器执行存储器存储的计算机执行指令,以实现如第一方面的逾期预测方法。

第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面的逾期预测方法。

第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面的逾期预测方法。

本申请提供的逾期预测方法,通过对金融属性进行时段属性的扩展处理,可以获得金融属性对应的时段属性,通过时段属性的扩展,可以从金融属性以及金融属性对应的时段属性中确定目标金融属性。目标金融属性对金融信息的定义更准确。通过目标金融属性对目标用户的待预测金融信息进行更准确的数据提取,实现目标金融数据的更全面更准确的的定义。进而以高精度的目标预测模型直接进行更准确的逾期预测,提高预测效率和准确度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1为本公开实施例提供的一种逾期预测系统的一个应用系统架构图;

图2为本公开实施例提供的一种逾期预测方法的一个实施例的流程图;

图3为本公开实施例提供的一种逾期预测方法的又一个实施例的流程图;

图4为本公开实施例提供的一种逾期预测方法的又一个实施例的流程图;

图5为本公开实施例提供的一种逾期预测方法的又一个实施例的流程图;

图6为本公开实施例提供的一种逾期预测装置的一个实施例的结构示意图;

图7为本公开实施例提供的一种逾期预测装置的又一个实施例的结构示意图;

图8为用来实现本公开实施例提供的逾期预测方法的电子设备的框图。

通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

本公开的技术方案可以应用于逾期预测场景中,通过对金融属性进行时段属性扩展,获得更全面的目标金融属性,提高金融属性的覆盖面,以更全面的目标金融属性对训练样本进行提取,获得相应的至少一个金融样本,以利用至少一个金融样本对逾期预测模型进行更准确的训练,提高逾期预测模型的训练效率。

相关技术中,关于用户逾期问题,一般是采用用户的流水、还款等金融信息进行还款特征的提取,然后采用统计学算法或者机器学习算法对用户的还款特征进行逾期结果的预测,获得预测结果。但是采用上述方案进行逾期预测的准确度并不高。

为了解决上述问题,发明人想到,由于现有的金融信息多是单一时间采集的金融信息,金融信息直接提取特征时,提取到的金融特征的信息含量并不高,为了解决上述问题,本公开实施例中,可以采用将金融信息进行时序属性上的扩展,获得更全面的金融属性,以提取更全面的金融特征,利用信息更全面的金融样本可以训练获得更准确的预测模型,提高逾期预测模型的准确度和精度。

本公开提供逾期预测方法、装置、设备、介质及产品,旨在解决现有技术的如上技术问题。可以应用于人工智能领域和金融领域,也可以应用于除人工智能领域和金融领域之外的任意领域。

本公开的技术方案中,可以通过对金融属性进行时段属性的扩展处理,可以获得金融属性对应的时段属性,通过时段属性的扩展,可以从金融属性以及金融属性对应的时段属性中确定目标金融属性。目标金融属性对金融信息的定义更准确。通过目标金融属性可以确定历史金融信息对应的金融样本,实现金融样本和目标金融数据的更全面的定义。进而实现目标预测模型的模型训练准确度的提升,提高目标预测模型的训练精度和准确度,以通过高精度的目标预测模型直接进行更准确的逾期预测,提高预测效率和准确度。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

如图1所示,为本公开实施例提供的一种逾期预测系统的一个应用系统架构图,该故障预测系统可以包括:配置有本公开提供的目标预测模型的训练方法的第一电子设备1,配置有本公开提供的逾期预测方法的第二电子设备2。第二电子设备2可以与第一电子设备1建立有线或无线的通信连接。

参考图1,在实际应用中,第一电子设备1可以为云服务器。第一电子设备1可以采集至少一个用户分别对应的历史金融信息,获得至少一个历史金融信息,以通过本公开提供的目标预测模型的训练方法所对应的至少一个历史金融信息,在时段属性扩张获得的目标金融属性的基础上,对训练样本进行确定,以利用至少一个训练样本训练构成的逾期预测模型,获得目标预测模型。

第二电子设备2可以对外提供逾期预测服务,用户可以向第二电子设备发起目标网络设备的逾期预测请求,第二电子设备2可以基于本公开提供的逾期预测方法,获取目标用户的待预测金融信息,并利用目标金融属性进行目标金融数据的提取,以最终通过目标金融数据完成目标用户的逾期预测,获得相应的逾期预测结果。通过准确的目标预测模型可以进行目标用户的逾期预测,提高逾期预测模型的预测准确度和效率。

如图2所示,为本公开实施例提供的一种逾期预测方法的一个实施例的流程图,该逾期预测方法可以应用于逾期预测装置中,该逾期预测装置可以位于电子设备中,其中,逾期预测方法可以包括以下几个步骤:

201:响应于针对目标用户的逾期预测请求,获得目标用户的待预测金融信息;待预测金融信息包括金融属性对应的金融数据。

202:对金融属性进行属性扩展处理,获得金融属性对应的时段属性。

时段属性可以指对任一个金融属性进行时段进行扩展获得的新属性,例如,金融属性对应的金融数据一般是按照一定的时间间隔采集获得的,例如可以每间隔24小时采集一次金融属性对应的金融数据。为了对金融数据进行更全面的分析,可以对金融属性进行时段扩展,也即可以为金融属性设置更长时段的时段属性。时段属性可以是针对对应的金融属性设置的。以贷款属性为例,可以为贷款属性设置至少一个时段对应的时段属性,例如7天贷款属性、30天贷款属性、60天贷款属性、180天贷款属性等。任一个金融属性对应的时段属性可以包括至少一个。时段属性的数量越多,对金融属性的时间分析角度越多,通过金融属性和时段属性表示的样本数据的信息含量更全面,有效率更高。

203:根据金融属性和金融属性对应的时段属性,确定目标金融属性。

目标金融属性可以从金融属性和金融属性对应的时段属性中选择获得。目标金融属性可以包括一个或多个。

目标金融属性可以包括参与训练样本的数据提取的属性,可以用于对训练数据和目标金融数据的提取。

204:基于目标金融属性,确定待预测金融信息对应的目标金融数据。

可选地,若确定目标金融属性为原有的金融属性,则可以直接从待预测金融信息中读取该原有的金融属性对应金融数据,获得目标金融数据。若确定目标金融属性为扩展的时段属性,则可以利用待预测金融信息在时段属性对应的金融属性的金融数据进行数据计算,获得时段属性对应的金融数据。目标金融数据可以包括从待预测金融信息中为目标金融属性确定的金融数据。

205:将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。

其中,目标预测模型基于下述实施例提供的目标预测模型的训练方法训练获得。

本公开实施例中,通过响应于针对目标用户的逾期预测请求,可以获得目标用户的待预测金融信息,该待预测的金融信息可以包括金融属性对应的金融数据。通过对金融属性进行属性扩展处理,获得金融属性对应的时段属性,以根据金融属性和金融属性对应的时段属性,确定目标金融属性。通过目标金融属性,可以对待预测金融信息进行目标金融数据的提取,从而利用目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。通过目标预测模型可以对目标用户进行快速而准确的逾期预测,提高逾期预测效率和准确度。

作为一个实施例,目标预测模型包括第一预测模型和第二预测模型组合获得的模型。

将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果,包括:

将目标金融数据输入目标预测模型中的第一预测模型,获得第一预测概率;

将目标金融数据输入目标预测模型中的第二预测模型,获得第二预测概率;

对第一预测概率和第二预测概率进行加权求和,获得目标预测概率;

利用目标预测概率,生成目标用户的逾期预测结果。

关于目标预测概率的计算步骤可以与前述实施例中目标逾期概率的计算步骤相同,具体可以参考目标逾期概率的计算步骤,在此不再赘述。

本公开实施例中,通过目标预测模型预测目标用户的逾期预测结果时,可以采用目标预测模型中的第一预测模型和第二预测模型分别对目标金融数据进行逾期概率的预测,可以获得第一预测概率和第二预测概率。通过将第一预测概率和第二预测概率的加权求和,可以获得准确的目标预测概率,以利用目标预测概率,生成目标用户的逾期预测结果。通过目标预测概率的计算,可以对目标用户的逾期预测结果进行准确获取,提高逾期预测结果的获取效率和准确度。

在某些实施例中,对第一预测概率和第二预测概率进行加权求和,获得目标预测概率,包括:

确定目标逾期模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重;

基于第一预测模型对应的第一权重和第二预测模型对应的第二权重,将第一预测概率和第二预测概率加权求和,获得目标预测概率。

本公开实施例中,确定目标逾期模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重,以利用该第一权重和第二权重将第一预测概率和第二预测概率进行加权求和,获得目标预测概率。通过将两个预测模型的预测概率进行加权求和,可以获得准确的目标预测概率。

作为又一个实施例,利用目标预测概率,生成目标用户的逾期预测结果,包括:

若确定目标预测概率大于概率阈值,则确定逾期为目标用户的逾期预测结果;

若确定目标预测概率小于或等于概率阈值,则确定不逾期为目标用户的逾期预测结果。

概率阈值可以根据实际的使用需求设置。

本公开实施例中,确定目标预测概率大于概率阈值时,可以确定逾期为目标用户的逾期预测结果,若确定目标预测概率小于或等于概率阈值,则确定不逾期为目标用户的逾期预测结果。通过概率阈值的设置,可以利用目标预测概率对目标用户进行准确的逾期判断,提高逾期预测结果的准确度和判断效率。

作为一个实施例,上述步骤202:对金融属性进行属性扩展处理,获得金融属性对应的时段属性,可以包括:

采集至少一个用户分别对应的历史金融信息,获得至少一个历史金融信息;历史金融信息包括金融属性对应的金融数据;

确定为至少一个历史金融信息设置的统计时段;

基于金融属性在统计时段对应的统计类型,确定金融属性在统计时段对应的时段属性。

为至少一个历史金融信息设置的统计时段可以包括至少一个。在实际应用中,至少一个统计时段例如可以包括7天、30天、60天、90天、180天以及360天中的至少一个。当然,上述的至少一个统计时段仅仅是示意性的,并不应构成对统计时段的具体限定。

金融属性在统计时段对应的统计类型可以指在该统计时段内对该金融属性的金融数据具体处理方式。例如,金融属性为存款属性时,金融属性对应的金融数据为存款金额,统计时段为7天,存款属性在7天这一统计时段对应的统计类型具体可以是对7天内的存款进行均值计算,该“对7天内的存在进行均值计算”即为存款属性在统计时段对应的统计类型。任一个金融属性可以在至少一个统计时段分别对应有时段属性,也即任一个金融属性可以对应至少一个时段属性,可以实现对金融属性的时段扩展,获得更全面的时段统计信息。

获得金融属性对应的时段属性之后,可以利用金融属性对应的金融数据计算时段属性对应的金融数据。例如,以7天均值时段属性为例,可以利用金融属性对应的金融数据进行7天均值的计算,获得的金融数据的7天均值的取值即可以为7天时段属性对应的金融数据。

本公开实施例中,在对金融属性进行属性扩展处理时,可以设置统计时段,统计时段可以用于对历史金融信息中的金融数据进行结果计算。通过金融属性在统计时段对应的计算结果可以确定该金融属性在统计时段对应的时段属性,获得金融属性在统计时段对应的时段属性。实现对时段属性的统计扩展计算,提高时段属性的扩展准确度。

作为一个实施例,从金融属性和时段属性中确定目标金融属性时,参考图3,与图2的不同之处在于,上述步骤203:根据金融属性和金融属性对应的时段属性,确定目标金融属性,可以包括:

301:确定金融属性和金融属性对应的时段属性为候选属性。

候选属性可以包括金融属性和金融属性对应的时段属性,任一个金融属性可以对应至少一个时段属性。因此,候选属性可以包括至少一个。任一个候选属性均可以进行属性计量计算。

302:基于特征权重算法对候选属性进行属性计量计算,获得候选属性对应的属性计量值。

属性计量值可以标识候选属性对金融信息的信息表达的重要程度。属性计量值越高,候选属性对金融信息的信息表达的重要程度越高,将对应的候选属性作为目标金融属性时,可以获得更全面更准确的信息,属性计量值越低,候选属性对金融信息的信息表达的重要程度越低。信息表达较高代表数据价值较高,对信息表达的准确度较高。

303:利用候选属性对应的属性计量值,从候选属性中选择属性计量值高于计量阈值的目标金融属性。

每个候选属性均可以对应有属性计量值,可以从至少一个候选属性中选择属性计量值高于计量阈值的目标金融属性。目标金融属性可以包括至少一个。

在实际应用中,若任一个候选属性的属性计量值过低,则说明该候选属性对金融信息的信息表达重要性过低,增加该候选属性只能增加数据的维度,增加数据计算复杂度,而并不能增加数据表达的准确性,因此,可以选择高于计量阈值的目标金融属性,以在确保金融信息中被采用的数据的有效性和准确性的同时,降低数据复杂度,提高数据处理效率,进而提升模型训练效率。

本公开实施例中,可以确定金融属性和金融属性对应的时段属性为候选属性。可以基于特征权重算法对候选属性进行属性计量计算,获得候选属性对应的属性计量值,以利用候选属性对应的属性计量值,从候选属性中选择属性计量值高于计量阈值的目标金融属性。通过特征权重算法可以对候选属性进行属性计量计算,获得准确的属性计量值,属性计量值可以标识金融属性的价值,利用属性计量值可以对候选属性进行准确选择。

在某些实施例中,步骤302:基于特征权重算法对候选属性进行属性计量计算,获得候选属性对应的属性计量值,可以包括以下几个步骤:

针对任一个用户的历史金融信息,从历史金融信息中提取候选属性对应的金融数据,以获得至少一个历史金融信息分别在候选属性对应的金融数据;

将至少一个历史金融信息在候选属性分别对应的金融数据输入到特征权重模型,计算获得候选属性的属性计量值。

可以提取历史金融信息中候选属性对应的金融数据。从历史金融信息中提取候选属性对应的金融数据可以包括:若确定候选属性为金融属性,则可以直接提取金融属性的金融数据。若确定候选属性为时段属性,则可以确定时段属性对应的金融属性,按照该时段属性对应的统计类型,对金融属性的金融数据按照该统计类型进行数据计算,获得该时段属性在对应的金融数据。例如,时段属性的统计类型为7天均值属性时,可以对时段属性对应金融信息的金融数据进行7天均值的计算,获得的7天均值为该时段属性的金融数据。

特征权重模型可以基于至少一个历史金融信息对候选属性进行属性计量计算,以获得该候选属性对应的属性计量值。

本公开实施例中,针对任一个用户的历史金融信息,可以从历史金融信息中提取候选属性对应的金融数据。之后可以将至少一个历史金融信息在候选属性分别对应的金融数据输入到特征权重模型,通过特征权重模型完成对候选属性的属性计量值计算,实现属性计量值的快速而准确的计算。

作为一种可能的实现方式,特征权重模型具体可以包括Relief(特征权重)模型。本公开实施例中是采用特征权重模型对候选属性进行属性计量计算的具体步骤,也即,将至少一个历史金融信息分别在候选属性分别对应的金融数据输入到特征权重模型,计算获得候选属性的属性计量值,具体可以包括:

从至少一个历史金融信息中随机选择第一金融信息;

针对任一个候选属性,计算第一金融信息在候选属性对应的样本差值,以获得至少一个历史金融信息分别作为第一金融信息时计算获得的样本差值;

将至少一个历史金融信息分别对应的样本差值进行均值计算,获得候选属性对应的属性计量值。

将至少一个历史金融信息分别对应的样本差值进行均值计算,获得候选属性对应的属性计量值可以包括:将至少一个历史金融信息分别对应的样本差值相加求和,获得样本总差值,确定至少一个历史金融信息的信息数量,计算样本总差值和信息数量的比值,获得候选属性对应的属性计量值。

本公开实施例中,利用特征权重模型对候选属性进行属性计量值计算时,可以从至少一个历史金融信息中随机选择第一金融信息,以针对任一个候选属性,计算第一金融信息在候选属性对应的样本差值,在实际应用中,每个历史金融信息均可以在候选属性计算一样本差值,因此,可以将至少一个历史金融信息分别对应样本差值进行均值计算,获得候选属性对应的属性计量值,通过均值计算的方式可以对候选属性的属性计量值进行准确计算,提高候选属性的计算准确度。

在某些实施例中,计算第一金融信息在候选属性对应的样本差值,具体可以包括:

读取候选属性在第一金融信息对应的第一金融数据;

从至少一个历史金融信息中选择与第一金融信息属于相同信息类型的第二金融信息,并确定第二金融信息在候选属性对应的第二金融数据;

计算第一金融数据和第二金融数据的第一差值;

从至少一个历史金融信息中选择与第一金融信息属于不同信息类型的第三金融信息,并确定第三金融信息在候选属性对应的第三金融数据;

计算第一金融数据和第三金融数据的第二差值;

将第一差值进行平方计算结果取负值和第二差值的平方计算结果相加,获得第一金融信息在候选属性对应的样本差值。

第一差值可以为第一金融数据和第二金融数据相减获得。第二差值可以为第一金融数据和第三金融数据相减获得。

金融信息的信息类型例如可以通过金融信息的金融属性确定。例如,投资理财属性对应的信息类型为理财信息类型。存款属性对应的信息类型为存款类型。相同信息类型在同一候选属性对应的金融数据可以包括该相同类型对应的金融属性的金融数据。不同信息类型在同一候选属性对应的金融数据可以包括该不同类型的信息在同一候选属性分别对应的金融数据。以信息类型为存款类型为例,在投资理财信息类型中可以存在存款属性对应的存款值,在保险信息类型中也可以存在存款属性对应的存款值。若从相同信息类型中读取存款属性对应的存款值,则是从投资理财信息类型对应的两条理财信息中读取存款值,若从不同信息类型中读取存款属性对应的存款值,则可以从投资理财信息类型对应的一条理财信息和保险信息类型对应的一条保险信息中分别读取存款值。

本公开实施例中,在计算第一金融信息在候选属性对应的样本差值时,可以将该第一金融信息与其在该候选属性的金融数据,进行同类样本和异类样本分别在该候选属性的金融数据进行差值计算,获得同类第二金融信息对应的第一差值和不同类型第三金融信息对应的第二差值,从而通过第一差值和第二差值的均方值进行计算,获得样本差值,提高差值计算准确度。

如图4所示,为本公开实施例提供的一种逾期预测方法的又一个实施例的流程图,与前述实施例的不同之处在于,其中,目标预测模型的具体训练步骤可以包括:

401:采集至少一个用户分别对应的历史金融信息,获得至少一个历史金融信息;历史金融信息包括金融属性对应的金融数据。

可选地,金融属性可以包括财产属性中的投资理财属性、存款属性、贷款属性、收入属性,交易属性中的流水属性,身份属性中的房产属性、私家车属性、婚姻属性、学历属性、保险属性,放款属性中的放款额度属性、历史调额属性,以及还款属性中的还款属性、用户还款逾期属性、逾期时间属性等属性中的至少一个。

其中,投资理财属性对应的金融数据可以为投资理财信息,存款属性对应的金融数据可以为存款金额,贷款属性对应的金融数据可以为贷款金额,收入属性对应的金融数据可以为收入金额,交易属性中的流水属性对应的金融数据可以为每笔银行流水信息,身份属性中的房产属性对应的金融数据可以为房产标识值,私家车属性对应的金融数据可以为车辆标记信息,婚姻属性对应的金融数据可以为婚姻标记值,学历属性对应的金融数据可以为学历标记值,保险属性对应的金融数据可以为保险种类和保额信息,放款属性中的放款额度属性对应的金融数据可以为放款额度,历史调额属性对应的金融数据可以为历史额度调整信息,以及还款属性中的还款属性对应的金融数据可以为还款金额、用户还款逾期属性对应的金融数据可以为逾期概率,逾期时间属性对应的金融数据可以为逾期天数。

可选地,每个金融属性对应的金融数据可以为归一化之后的数据,以便于对金融数据进行有效管理。

用户可以为在金融系统中存在金融账户的用户,用户可以在金融系统中进行账户注册,以使用金融系统的服务。在实际应用中,由于银行数量较多,用户所对应的历史金融信息可以从一个或多个金融系统也即银行的后台系统中读取获得,以确保获得的历史金融信息更全面。每个历史金融信息可以对应有相应的用户。

402:基于目标金融属性,确定至少一个历史金融信息分别对应的金融样本,以获得至少一个金融样本。

金融样本可以利用目标金融属性从历史金融信息中提取获得。

403:利用至少一个金融样本,训练构建的逾期预测模型,获得目标预测模型。

本公开实施例中,可以采集至少一个用户对应的历史金融信息,获得至少一个历史金融信息。历史金融信息包括金融属性对应的金融数据,以金融属性进行数据采集可以使得金融信息能够使用同一的信息表达方式,有利于信息的统一处理。通过对金融属性进行时段属性的扩展处理,可以获得金融属性对应的时段属性,实现时段属性的扩展,获得更多维度的信息。之后可以从金融属性以及金融属性对应的时段属性中确定目标金融属性。通过选择目标金融属性,可以有效降低样本的数据维度,提高数据处理效率,使用目标金融属性对金融信息的定义更准确。通过目标金融属性可以确定历史金融信息对应的金融样本,实现金融样本的更全面更高效的定义,获得至少一个金融样本。通过至少一个金融样本,可以对逾期预测模型进行训练,获得目标预测模型,提高目标预测模型的训练精度和准确度,以通过高精度的目标预测模型直接进行更准确的逾期预测,提高预测效率和准确度。

在实际应用中,金融样本可以包括样本数据和样本标签。为了获得准确的金融样本,在一种可能的设计中,基于目标金融属性,确定至少一个历史金融信息分别对应的金融样本,包括:

针对任一个历史金融信息,获取历史金融所对应用户的逾期还款标签;逾期还款标签包括:已逾期和未逾期;

基于目标金融属性,确定历史金融信息在目标金融属性对应的目标金融数据;

将历史金融信息在目标金融属性对应的目标金融数据作为训练数据,以及将还款标签作为样本标签,获得训练数据和样本标签构成的历史金融信息对应的金融样本,以获得至少一个历史金融信息分别对应的金融样本。

目标金融属性对应的目标金融数据可以通过历史金融信息确定。关于金融属性和时段属性的金融数据的获取方式已在前述实施例中描述,在此不再赘述。

本公开实施例中,针对任一个历史金融信息,可以获取历史金融信息所对应用户的逾期还款标签,通过逾期还款标签可以作为历史金融信息对应金融样本的样本标签。通过目标金融数据作为训练数据,可以结合样本标签,获得对金融样本的准确定义。

为了提高模型的训练效率,如图5所示,为本公开实施例提供的逾期预测方法中的又一个实施例,与前述的实施例的不同之处在于,逾期预测模型可以包括混合模型,预测预测模型可以包括第一预测模型和第二预测模型组合获得的模型。其中,步骤403:利用至少一个金融样本,训练构建的逾期预测模型,获得目标预测模型,可以包括:

501:对逾期预测模型中第一预测模型和第二预测模型进行参数初始化,获得第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数。

502:将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算,获得至少一个金融样本分别对应的第一逾期概率。

503:将金融样本对应的样本数据输入第二模型参数对应的第二预测模型进行逾期概率预测计算,获得至少一个金融样本分别对应的第二逾期概率。

504:基于至少一个金融样本分别对应的第一逾期概率和第二逾期概率进行逾期误差计算,获得逾期误差结果。

505:若确定逾期误差结果小于或等于逾期误差阈值,则确定第一模型参数对应的第一预测模型和第二模型参数对应的第二预测模型为目标预测模型。

逾期误差阈值可以根据实际的训练需求设置,逾期误差阈值越小,目标预测模型的精度越高,但是在逾期误差阈值不断减小时,目标预测模型可能出现过拟合,可以通过历史训练经验,选择训练准确度更高的逾期误差阈值。

本公开实施例中,对逾期预测模型进行训练时,可以对逾期预测模型中的第一预测模型和第二预测模型进行参数初始化,获得第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数。可以同时将金融样本输入到第一模型参数对应的第一预测模型和第二模型参数对应的第二预测模型,通过第一预测模型可以获得金融样本的第一逾期概率和通过第二预测模型可以获得金融样本的第二预测概率。通过第一逾期概率和第二逾期概率的误差统计可以获得逾期误差。逾期预测模型包含了第一预测模型和第二预测模型,以利用两个模型对金融样本均进行训练,获得准确的模型误差,实现对逾期预测模型的准确训练。

作为一个实施例,步骤504:基于至少一个金融样本分别对应的第一逾期概率和第二逾期概率进行逾期误差计算,获得逾期误差结果之后,该方法还可以包括:

若确定逾期误差结果大于逾期误差阈值,则基于逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,返回至将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算的步骤继续执行。

本公开实施例中,在逾期误差结果大于逾期误差阈值时,可以基于逾期误差结果更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,实现对第一预测模型和第二预测模型的模型参数的更新。之后可以返回至将金融样本对应的样本数据输入到第一模型参数对应的第一预测模型进行逾期概率预测计算的步骤继续执行,通过不断迭代更新模型参数,完成模型的训练,获得准确的目标预测模型。

在某些实施例中,上述步骤504:基于至少一个金融样本分别对应的第一逾期概率和第二逾期概率进行逾期误差计算,获得逾期误差结果,具体可以包括:

确定逾期预测模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重;

根据第一预测模型对应的第一权重和第二预测模型对应的第二权重,将金融样本对应的第一逾期概率和第二逾期概率进行加权求和,获得至少一个金融样本分别对应的目标逾期概率;

基于至少一个金融样本分别对应的目标逾期概率和至少一个金融样本分别对应的样本标签,进行逾期误差计算,获得逾期误差结果。

可选地,基于至少一个金融样本分别对应的目标逾期概率和至少一个金融样本分别对应的样本标签,进行逾期误差计算,获得逾期误差结果,可以包括:若任一个金融样本对应的目标逾期概率高于概率阈值,则确定该金融样本为预测逾期的预测标签,若该目标逾期概率小于或等于概率阈值,则确定该金融样本为预测不逾期的预测标签,以获得至少一个金融样本分别对应的预测标签。将任一个金融样本的预测标签和样本标签比较,若预测标签与样本标签相同,则该金融样预测成功,若该金融样本的预测标签和样本标签不同,则该金融样本预测失败,以获得至少一个金融样本分别对应的预测结果。确定预测失败的金融样本占所有金融样本的比例,获得逾期误差结果。

当然,除采用标签比较的方式之外,还可以采用标签距离计算,例如二范数距离,等方式计算逾期误差结果,具体的计算方式与相关技术相同,在此不再赘述。

本公开实施例中,可以确定逾期预测模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重,以根据第一预测模型对应的第一权重和第二预测模型对应的第二权重,将金融样本对应的第一逾期概率和第二逾期概率进行加权求和,获得至少一个金融样本分别对应的目标逾期概率。通过将两个预测模型的逾期概率按照各个模型的权重进行加权求和,可以确保两个预测模型的预测结果能够有效融合,以基于至少一个金融样本分别对应的目标逾期概率和至少一个金融样本分别对应的样本标签,进行逾期误差计算,获得逾期误差结果,提高逾期误差计算的准确度。

在某些实施例中,实际对模型进行训练过程中,可以对模型参数和模型权重进行更新,以获得更准确的逾期预测模型。因此,该方法还可以包括:

若确定逾期误差结果大于逾期误差阈值,则基于逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,同时更新第一预测模型对应的第一权重和第二预测模型对应的第二权重,返回至将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算的步骤继续执行。

基于逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,同时更新第一预测模型对应的第一权重和第二预测模型对应的第二权重具体可以是,利用梯度下降算法和逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,同时更新第一预测模型对应的第一权重和第二预测模型对应的第二权重。通过模型参数和模型权重的更新,可以实现对模型的训练迭代。

本公开实施例中,在确定逾期误差结果大于逾期误差阈值时,可以基于逾期误差结果更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数。还可以更新第一预测模型对应的第一权重和第二预测模型对应的第二权重,通过第一权重和第二权重、模型参数的不断更新可以实现模型的及时有效更新,提高模型训练准确度和精度。

如图6所示,为本公开实施例提供的一种逾期预测装置的一个实施例的结构示意图,该逾期预测装置可以配置有逾期预测方法,逾期预测装置可以位于电子设备中,其中,逾期预测装置600可以包括以下几个单元:

请求响应单元601:用于响应于针对目标用户的逾期预测请求,获得目标用户的待预测金融信息;待预测金融信息包括金融属性对应的金融数据。

属性扩展单元602:用于对金融属性进行属性扩展处理,获得金融属性对应的时段属性。

属性确定单元603:用于根据金融属性和金融属性对应的时段属性,确定目标金融属性。

信息确定单元604:用于基于目标金融属性,确定待预测金融信息对应的目标金融数据。

结果预测单元605:用于将目标金融数据输入训练获得的目标预测模型,获得目标用户的逾期预测结果。

作为一个实施例,目标预测模型包括第一预测模型和第二预测模型组合获得的模型。结果预测单元605,包括:

第三预测模块,用于将目标金融数据输入目标预测模型中的第一预测模型,获得第一预测概率;

第四预测模块,用于将目标金融数据输入目标预测模型中的第二预测模型,获得第二预测概率;

概率确定模块,用于对第一预测概率和第二预测概率进行加权求和,获得目标预测概率;

结果生成模块,用于利用目标预测概率,生成目标用户的逾期预测结果。

在某些实施例中,概率确定模块,可以包括:

第二确定子模块,用于确定目标逾期模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重;

第二加权子模块,用于基于第一预测模型对应的第一权重和第二预测模型对应的第二权重,将第一预测概率和第二预测概率加权求和,获得目标预测概率。

作为一种可能的实现方式,结果生成模块,可以包括:

第一判断子模块,用于若确定目标预测概率大于概率阈值,则确定逾期为目标用户的逾期预测结果;

第二判断子模块,用于若确定目标预测概率小于或等于概率阈值,则确定不逾期为目标用户的逾期预测结果。

作为一个实施例,属性扩展单元602,可以包括:

时段确定模块,用于确定为至少一个历史金融信息设置的统计时段;

属性确定模块,用于基于金融属性在统计时段对应的统计类型,确定金融属性在统计时段对应的时段属性。

在某些实施例中,属性确定单元603,包括:

候选确定模块,用于确定金融属性和金融属性对应的时段属性为候选属性;

计量计算模块,用于基于特征权重算法对候选属性进行属性计量计算,获得候选属性对应的属性计量值;

目标计算模块,用于利用候选属性对应的属性计量值,从候选属性中选择属性计量值高于计量阈值的目标金融属性。

在某些实施例中,计量计算模块,包括:

数据确定子模块,用于针对任一个用户的历史金融信息,从历史金融信息中提取候选属性对应的金融数据,以获得至少一个历史金融信息分别在候选属性对应的金融数据;

计量计算子模块,用于将至少一个历史金融信息在候选属性分别对应的金融数据输入到特征权重模型,计算获得候选属性的属性计量值。

在某些实施例中,计量计算子模块,具体可以用于:

从至少一个历史金融信息中随机选择第一金融信息;

针对任一个候选属性,计算第一金融信息在候选属性对应的样本差值,以获得至少一个历史金融信息分别作为第一金融信息时计算获得的样本差值;

将至少一个历史金融信息分别对应的样本差值进行均值计算,获得候选属性对应的属性计量值。

作为又一个实施例,计量计算子模块,具体可以用于:

读取候选属性在第一金融信息对应的第一金融数据;

从至少一个历史金融信息中选择与第一金融信息属于相同信息类型的第二金融信息,并确定第二金融信息在候选属性对应的第二金融数据;

计算第一金融数据和第二金融数据的第一差值;

从至少一个历史金融信息中选择与第一金融信息属于不同信息类型的第三金融信息,并确定第三金融信息在候选属性对应的第三金融数据;

计算第一金融数据和第三金融数据的第二差值;

将第一差值进行平方计算结果取负值和第二差值的平方计算结果相加,获得第一金融信息在候选属性对应的样本差值。

如图7所示,为本公开实施例提供的一种逾期预测装置的又一个实施例的结构示意图,与图6所示的实施例的不同之处在于,逾期预测装置还可以包括以下几个单元:

数据采集单元701:用于采集至少一个用户对应的历史金融信息,获得至少一个历史金融信息;历史金融信息包括金融属性对应的金融数据。

样本确定单元702:用于基于目标金融属性,确定至少一个历史金融信息分别对应的金融样本,以获得至少一个金融样本。

模型训练单元703:用于利用至少一个金融样本,训练构建的逾期预测模型,获得目标预测模型。

作为一个实施例,样本确定单元702,可以包括:

标签确定模块,用于针对任一个历史金融信息,获取历史金融所对应用户的逾期还款标签;逾期还款标签包括:已逾期和未逾期;

数据确定模块,用于基于目标金融属性,确定历史金融信息在目标金融属性对应的目标金融数据;

样本确定模块,用于将历史金融信息在目标金融属性对应的目标金融数据作为训练数据,以及将还款标签作为样本标签,获得训练数据和样本标签构成的历史金融信息对应的金融样本,以确定至少一个历史金融信息分别对应的金融样本。

在某些实施例中,逾期预测模型包括第一预测模型和第二预测模型组合获得的模型,模型训练单元703,可以包括:

参数确定模块,用于对逾期预测模型中第一预测模型和第二预测模型进行参数初始化,获得第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数;

第一预测模块,用于将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算,获得至少一个金融样本分别对应的第一逾期概率;

第二预测模块,用于将金融样本对应的样本数据输入第二模型参数对应的第二预测模型进行逾期概率预测计算,获得至少一个金融样本分别对应的第二逾期概率;

误差计算模块,用于基于至少一个金融样本分别对应的第一逾期概率和第二逾期概率进行逾期误差计算,获得逾期误差结果;

第一确定模块,用于若确定逾期误差结果小于或等于逾期误差阈值,则确定第一模型参数对应的第一预测模型和第二模型参数对应的第二预测模型为目标预测模型。

在某些实施例中,该装置还可以包括:

第二确定模块,用于若确定逾期误差结果大于逾期误差阈值,则基于逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,返回至将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算的步骤继续执行。

作为一个实施例,误差计算模块,可以包括:

第一确定子模块,用于确定逾期预测模型中第一预测模型对应的第一权重和第二预测模型对应的第二权重;

第一加权子模块,用于根据第一预测模型对应的第一权重和第二预测模型对应的第二权重,将金融样本对应的第一逾期概率和第二逾期概率进行加权求和,获得至少一个金融样本分别对应的目标逾期概率;

误差确定子模块,用于基于至少一个金融样本分别对应的目标逾期概率和至少一个金融样本分别对应的样本标签,进行逾期误差计算,获得逾期误差结果。

在某些实施例中,该装置还可以包括:

第三确定模块,用于若确定逾期误差结果大于逾期误差阈值,则基于逾期误差结果,更新第一预测模型对应的第一模型参数和第二预测模型对应的第二模型参数,同时更新第一预测模型对应的第一权重和第二预测模型对应的第二权重,返回至将金融样本对应的样本数据输入第一模型参数对应的第一预测模型进行逾期概率预测计算的步骤继续执行。

本公开提供的装置可以用于执行对应的方法,关于各个装置的具体执行步骤和技术效果可以参考相关方法的描述,在此不再赘述。

上述电子设备可以是无线终端也可以是有线终端。无线终端可以是指向用户提供语音和/或其他业务数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(Radio Access Network,简称RAN)与一个或多个核心网设备进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。再例如,无线终端还可以是个人通信业务(Personal Communication Service,简称PCS)电话、无绳电话、会话发起协议(Session Initiation Protocol,简称SIP)话机、无线本地环路(Wireless Local Loop,简称WLL)站、个人数字助理(Personal Digital Assistant,简称PDA)等设备。无线终端也可以称为系统、订户单元(Subscriber Unit)、订户站(Subscriber Station),移动站(MobileStation)、移动台(Mobile)、远程站(Remote Station)、远程终端(Remote Terminal)、接入终端(Access Terminal)、用户终端(User Terminal)、用户代理(User Agent)、用户设备(User Device or User Equipment),在此不作限定。可选的,上述电子设备还可以是智能手表、平板电脑等设备。

图8是根据一示例性实施例示出的一种电子设备的框图,该设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。需要说明的是,本公开涉及到的“第一电子设备”“第二电子设备”中的“第一”和“第二”仅仅是为了区分不同的电子设备,并不具备数量、顺序上的含义,第一电子设备和第二电子设备的具体结构均可以参考图8所示的示意图。

装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述电子设备的逾期预测方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号