首页> 中国专利> 智能交易主体属性识别模型训练方法、识别方法及装置

智能交易主体属性识别模型训练方法、识别方法及装置

摘要

本发明提供一种智能交易主体属性识别模型训练方法、识别方法及装置,所述训练方法包括:在区块链交易节点获取待选参量以及每个待选参量在多个样本中的定量数据值并统一量纲得到归一化数据;将单一待选参量对应的各样本的归一化数据按数值大小排序并依次标记序号作为秩,将归一化数据值相同的样本间的秩求平均并替代原秩的值,以得到该单一待选参量对应的各样本的相关秩;计算该单一待选参量对应的第一属性样本与整体样本的平均秩差值;将各待选参量对应的平均秩差值的绝对值分别与显著性水平值对比,若大于显著性水平值则保留,否则剔除,以得到用于模型训练的第一参量集,基于第一参量集训练预设神经网络模型。

著录项

  • 公开/公告号CN112364982A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 沈沉;

    申请/专利号CN202011257934.5

  • 申请日2020-11-12

  • 分类号G06N3/04(20060101);G06N3/08(20060101);G06Q40/04(20120101);

  • 代理机构11612 北京金咨知识产权代理有限公司;

  • 代理人秦景芳

  • 地址 100125 北京市朝阳区麦子店街2号楼1202

  • 入库时间 2023-06-19 09:54:18

说明书

技术领域

本发明涉及数据分析处理技术领域,尤其涉及一种智能交易主体属性识别模型训练方法、识别方法及装置。

背景技术

在对一主体的某一属性进行识别的过程中,需要对用于识别的参量进行筛选,通常情况下由人为主观判断和决定选取对属性识别结果作用较大的参量。但是基于主观设定的标准和判断进行筛选的过程受人为主观因素影响过大,且在人为处理能力有限的基础上,难以满足一次性筛选多参量的要求,无法分析得到对识别结果实际影响作用较大的参量。

在基于区块链技术的交易或融资场景下,需要对交易主体的属性进行识别,例如经营状态属性、信用水平属性、发展潜力属性等,由于交易过程中能够识别主体属性的参量种类和数量庞大,这些参数若直接用于分析,运算量过于庞大。而基于人为主观筛选参量进行识别,又会引入主观不确定性,无法客观提取对识别结果作用最大的参量,使得识别结果的可信度不高。

发明内容

本发明实施例提供了一种智能交易主体属性识别模型训练方法、识别方法及装置,以克服人为筛选参量不客观且准确度低的问题,同时提升属性识别的速度和精度。

本发明的技术方案如下:

一方面,本发明提供一种智能交易主体属性识别模型训练方法,包括:

在区块链交易节点获取多个待选参量,以及每个待选参量在多个样本中的定量数据值,将所述定量数据值统一量纲得到归一化数据,所述样本由多个第一属性样本和第二属性样本组成;

将单一待选参量对应的各样本的所述归一化数据按数值大小排序并依次标记序号作为秩,将归一化数据值相同的样本间的秩求平均并替代原秩的值,以得到该单一待选参量对应的各样本的相关秩;

计算该单一待选参量对应的所述第一属性样本与整体样本的平均秩差值;

将各待选参量对应的平均秩差值的绝对值分别与显著性水平值对比,若大于所述显著性水平值则保留,否则剔除,以得到用于模型训练的第一参量集;

获取各样本关于所述第一参量集中各参量的数据,并添加属性识别结果作为标签形成训练样本集;

采用所述训练样本集对预设神经网络模型进行训练,得到属性识别模型。

在一些实施例中,计算该单一待选参量对应的所述第一属性样本与整体样本的平均秩差值之后,还包括:

计算所述第一属性样本关于该单一待选参量的相关秩的标准偏差;

采用所述标准偏差修正所述平均秩差值;

将各待选参量对应的修正后平均秩差值的绝对值分别与所述显著性水平值对比,若大于所述显著性水平值则保留,否则剔除,以得到第一参量集。

在一些实施例中,采用所述标准偏差修正所述平均秩差值,计算式为:

其中,Z

在一些实施例中,所述标准偏差的计算式为:

其中,m为所述第一属性样本数量,n为所述第二属性样本数量,τ

在一些实施例中,将各待选参量对应的平均秩差值的绝对值分别与显著性水平值对比,若大于所述显著性水平值则保留,否则剔除,以得到第一参量集之后,还包括:

对所述第一参量集中的各参量两两计算秩相关系数,若存在两个参量k和l的秩相关系数大于判定值,则移除其中平均秩差值较低的参量;

其中,两个参量k和l的秩相关系数定义为:

在一些实施例中,将所述定量数据值统一量纲得到归一化数据中,所述定量数据值包括正向参量数据、负向参量数据和区间参量数据;

所述正向参量数据统一量纲的计算式为:

所述负向参量数据统一量纲的计算式为:

所述区间参量数据的统一量纲的计算式为:

其中,x

在一些实施例中,所述预设神经网络为BP神经网络,所述BP神经网络的损失函数E为:

其中,Q为样本数,T

在一些实施例中,作为标签的所述属性识别结果划分由低到高的多个等级。

另一方面,本发明还提供一种智能交易主体属性识别方法,包括:

获取利用上述智能交易主体属性识别模型训练方法得到的属性识别模型,并获取所述属性识别模型对应的参量;

从区块链交易节点获取待识别主体关于各参量的数据值,输入至所述属性识别模型,计算得到所述待识别主体的属性识别结果。

另一方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述方法的步骤。

本发明的有益效果至少是:

本发明所述智能交易主体属性识别模型训练方法、识别方法及装置,基于区块链交易平台中产生的数据进行分析,能够保障数据来源更可信。所述模型训练方法对每个待选参量对应的样本数据进行归一化处理后分配秩并修正得到相关秩,通过计算第一属性样本和整体样本间相关秩平均值的差,以分析每个待选参量在第一属性样本和整体样本中所呈现的差异性,其中,一待选参量在第一属性样本和整体样本间的相关秩平均值的绝对值越大则越能区分第一属性样本和第二属性样本。通过对参量的筛选能够得提升属性识别精度,筛选过程不依赖人为判断,更客观可信。进一步地,基于大量现有数据对人工智能神经网络训练得到属性识别模型并用于识别,杜绝了认为主观因素的影响,使识别结果更加准确。

本发明的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在书面说明及其权利要求书以及附图中具体指出的结构实现到并获得。

本领域技术人员将会理解的是,能够用本发明实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:

图1为本发明一实施例所述智能交易主体属性识别模型训练方法的流程示意图;

图2为本发明一实施例所述智能交易主体属性识别模型训练方法中修正平均秩差值流程示意图;

图3为本发明一实施例所述智能交易主体属性识别方法的流程示意图;

图4为基于区块链交易平台的可信交易流程示意图;

图5为基于区块链交易平台的融资流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。

在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。

应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。

在对一主体的某一属性进行识别的过程中,用于分析识别的参量通常是基于人的主观判断选取的,分析者基于自身对相应参量的认识选取对识别结果作用较大的参量。但是这种人为选取的方式并不客观,无法选取到实际对识别结果作用最大的参量,并且这种选取方式的分析能力时有限的,无法一次性处理大量的参量。

在智能交易场景中,交易和融资借贷都需要对交易主体的部分属性进行识别,例如经营状态属性、发展潜力属性或违约状态属性等进行识别,其中,识别的依据就是区块链智能交易平台记录的企业的基本信息、交易数据、订单状态、库存信息等非财务数据,且区块链技术保证了数据的可靠性。

本发明提供一种智能交易主体属性识别模型训练方法,如图1所示,包括步骤S101~S106:

需要强调的是,步骤S101~S106并不是对各步骤顺序的限定,应当认为,在特定的使用场景下,部分步骤可以并行或调换顺序。另外,区块链交易节点是指,利用区块链进行交易时,用于记录数据的一个或多个节点。

步骤S101:在区块链交易节点获取多个待选参量,以及每个待选参量在多个样本中的定量数据值,将所述定量数据值统一量纲得到归一化数据,样本由多个第一属性样本和第二属性样本组成。

步骤S102:将单一待选参量对应的各样本的归一化数据按数值大小排序并依次标记序号作为秩,将归一化数据值相同的样本间的秩求平均并替代原秩的值,以得到该单一待选参量对应的各样本的相关秩。

步骤S103:计算该单一待选参量对应的第一属性样本与整体样本的平均秩差值。

步骤S104:将各待选参量对应的平均秩差值的绝对值分别与显著性水平值对比,若大于显著性水平值则保留,否则剔除,以得到用于模型训练的第一参量集。

步骤S105:获取各样本关于第一参量集中各参量的数据,并添加属性识别结果作为标签形成训练样本集。

步骤S106:采用训练样本集对预设神经网络模型进行训练,得到属性识别模型。

在步骤S101中,从区块链交易节点中获取以往交易过程中记录的多个主体的交易数据,其中可以包括企业的基本信息、交易数据、订单状态、库存信息等非财务数据,且区块链技术保证了数据的可靠性。对相关参量分别采集多个样本的定量数据,定量数据是指以数量形式存在着的属性,并可以对其进行测量的数据类型。不同的待选参量之间由于量纲不统一,不能直接进行比较。为了实现不同待选参量之间的对比分析,对各样本关于各待选参量的数据均进行统一量纲处理。统一量纲可以采用归一化的方式,在另一些实施例中,还可以采用正向化或逆向化。

具体的,将定量数据值统一量纲得到归一化数据中,定量数据值包括正向参量数据、负向参量数据和区间参量数据;

正向参量数据统一量纲的计算式为:

所述负向参量数据统一量纲的计算式为:

所述区间参量数据的统一量纲的计算式为:

其中,x

进一步的,第一属性和第二属性实际上是相互对立的两个方面,例如违约或非违约,具有较高的发展潜力或不具有较高发展潜力。

在步骤S102中,逐一对各待选参量进行分析,判断其对于评价样本是否符合第一属性的作用大小。具体的,将单一参量对应的各样本归一化数据按照数值大小升序或降序排列,并添加序号作为秩。在统一量纲的过程中,单一参量对应的各样本中,可能存在数个样本的归一化数据值一致的情形,在排序过程中归一化数据值相同的被分配了不同的秩,这造成了区别化而不利于评价,因此,本实施例通过对归一化数据值相同的各样本的秩求平均,并替代原秩,以修正得到相关秩。示例性的,对于某一参量的10个样本,归一化数据排序后为0.1、0.2、0.2、0.3、0.4、0.4、0.4、0.4、0.5和0.6。添加序号得到各样本的秩为1、2、3、4、5、6、7、8、9以及10。这其中,3个样本的归一化数据为0.2,4个样本的归一化数据为0.4,值相同却被分配了不同的秩,不利于后续比较,因此,采用平均值替换原秩,得到各样本的相关秩为:1、2.5、2.5、4、6.5、6.5、6.5、6.5、9以及10。

对某一个待选参量而言,若其对样本属性识别结果的影响较小,则第一属性样本与第二属性样本关于该参量的值的分布差异较小或趋近于没有差异,各样本关于该参量归一化数据会均匀分布在[0,1]区间内,第一属性样本的秩的平均值与第二属性样本秩的平均值应当趋于一致,第一属性样本的秩的平均值与整体样本秩的平均值也趋于一致。相反的,对某一个待选参量而言,若其对样本属性识别结果的影响较大,则第一属性样本与第二属性样本关于该参量的值的分布差异较大,各样本关于该参量归一化数据会在[0,1]区间内分化,第一属性样本的秩的平均值与第二属性样本秩的平均值应当差异较大,第一属性样本的秩的平均值与整体样本秩的平均值差异也较大。

因此,在步骤S103中,基于修正后得到的相关秩,计算单一待选参量对应的第一属性样本和整体样本的平均秩差值,用于评价该待选参量是否对识别结果有较大影响。

在一些实施例中,步骤S103之后,计算该单一待选参量对应的所述第一属性样本与整体样本的平均秩差值之后,如图2所示,还包括步骤S1031~S1033:

步骤S1031:计算第一属性样本关于该单一待选参量的相关秩的标准偏差。

步骤S1032:采用标准偏差修正平均秩差值。

步骤S1033:将各待选参量对应的修正后平均秩差值的绝对值分别与显著性水平值对比,若大于显著性水平值则保留,否则剔除,以得到第一参量集。

在一些实施例中,标准偏差可以采用样本标准偏差公式计算。

在一些实施例中,步骤S1031中的标准偏差的计算式为:

其中,m为第一属性样本数量,n为第二属性样本数量,τ

在一些实施例中,步骤S1032中,采用标准偏差修正平均秩差值,计算式为:

其中,Z

在步骤S104中,为了划分对识别结果的影响力大小,可以预设显著性水平值。将各待选参量对应的平均秩差值的绝对值与显著性水平值对比,大于显著性水平值则保留,否则剔除,最终在待选参量中帅选得到用于模型训练的第一参量集。

在一些实施例中,步骤S104之后,即将各待选参量对应的平均秩差值的绝对值分别与显著性水平值对比,若大于所述显著性水平值则保留,否则剔除,以得到第一参量集之后,还包括步骤S1041:

步骤S1041:对第一参量集中的各参量两两计算秩相关系数,若存在两个参量k和l的秩相关系数大于判定值,则移除其中平均秩差值较低的参量;

其中,两个参量k和l的秩相关系数定义为:

在步骤S105中,基于第一参量集中的参量获取各样本的数据,作为训练预设神经网络面模型的输入数据。对每个样本的数据添加属性识别结果作为标签,进一步地,属性识别结果可以仅标记第一属性样本或第二属性样本,也可以划分由低到高的多个等级。

各样本的各参量数据以及相应的标签构成了用于训练神经网络模型的训练样本集。

在步骤S106中,预设神经网络模型可以采用BP神经网络模型、径向基神经网络模型、随机森林或其他神经网路模型。

在一些实施例中,预设神经网络为BP神经网络,BP神经网络的损失函数E为:

其中,Q为样本数,T

另一方面,本发明还提供一种智能交易主体属性识别方法,如图3所示,包括步骤S201~S202:

步骤S201:获取利用上述智能交易主体属性识别模型训练方法得到的属性识别模型,并获取属性识别模型对应的参量。

步骤S202:从区块链交易节点获取待识别主体关于各参量的数据值,输入至属性识别模型,计算得到待识别主体的属性识别结果。

在本实施例中,步骤S201中的参量为属性识别模型中输入层对应的参量,也即步骤S104中第一参量集中所包含的参量。由于用于训练属性识别模型的参量是基于区块链中的数据筛选得到的,因此,在采集样本的数据之前,需要先确认是属性识别模型需要输入的参量的种类。

在步骤S202中,根据训练属性识别模型是采用的标签的差异,待识别主体经过计算输出的属性识别结果可以是对第一属性样本或第二属性样本的判断,也可以是由低到高的多个等级。

另一方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述方法的步骤。

具体的,下面基于一示例进行详细说明:

本申请中的待选参量和相应的数据都是从区块链交易节点获取的,基于区块链的智能交易平台包括4类节点,分别是中小企业节点、资金提供方、第三方物流以及监管中心。该平台主要为中小企业提供可信交易、供应链融资以及信用融资,借助区块链技术,保证平台数据真实可信,避免恶意违约风险,传递核心企业信用,降低中小企业融资难度。

其中,可信交易场景下,通过供应商供给与销售商需求的对比,平台实现订单匹配,促使交易完成,如图4所示,具体包括:

(1)各家企业向平台提交自身数据,如销售商上传购买商品种类、数量以及预期价格区间,供应商上传库存商品种类、数量以及商品价格区间等。

(2)平台调用属性识别模块对供应商和销售商进行属性识别,主要测评交易过程中销售商的货款支付能力以及供应商的商品供给能力;其次调用订单匹配模块对各方需求与供给进行计算,得到最优的匹配方案,并将结果返回企业。

(3)销售商和供货商签订订单合同,基于区块链的智能交易平台根据该合同生成智能合约,当智能合约条件满足时,供应商自动发货且销售商提交货款,完成交易过程。当供应商无法如期提供商品或销售商未按规定提交货款时,智能合约将自动暂停供应商或销售商的后期交易,并将违约信息上传到区块链。

在融资场景下,基于区块链的智能交易平台,保证了中小企业数据的真实性、不可篡改性和可追溯性,如图5所示,具体步骤包括:

(1)中小企业加入智能交易平台时,向平台提交自身企业资质,包括企业注册资本、股东情况以及专利信息等,并不断在平台上更新自身数据。

(2)企业在发展过程中遇到资金问题,向金融机构申请融资。

(3)金融机构向智能交易平台提出申请,对贷款企业进行属性识别。

(4)智能交易平台根据企业资质信息、实时交易信息、库存信息以及订单消息对企业进行属性识别,并将识别结果返回金融机构。

(5)金融机构根据智能交易平台识别结果与贷款企业签订相关贷款合同,并根据该合同生成智能合约,当智能合约条件满足时,银行向企业发放贷款。当企业未按合约履行还款义务时,智能合约将自动暂停该企业的其他交易活动,并将违约信息上传区块链。

进一步地,在可信交易和融资场景下,基于区块链的智能交易平台为中小企业提供可信交易和融资服务,区块链保证了数据的真实性,但智能交易具有非面对面、虚拟性强和动态变化的特点,需要在智能交易与融资之前对企业进行属性识别。针对智能交易的特点,本实施例给出了一个基于秩和校验和BP神经网络的主体属性识别模型,首先从智能平台上获取用于评价企业主体的待选参量以及相应的数据,其次利用秩和校验和秩相关分析筛选出参量体系,并以此作为BP神经网络的输入进行模型训练和属性识别。

具体的,主体违约状态识别的过程包括:

1.筛选用于违约识别的参量

1.1参量数据标准化

参量可以分为定量数据和定性数据,不同种类参量的标准化过程有所区别。定性数据参量的标准化过程难以利用数学公式表示,由于同一个定性参量存在不同的状态,可以基于专家识别法确定数值,从而实现定性数据的定量化。在一般场景下,可以不考虑定性参量。

定量数据参量的标准化过程主要是指将单位、量纲和数据集不同的参量转化为[0,1]区间的无量纲数据,其分为正向参量、负向参量和区间参量。定量参量的数据标准化过程如下:设x

正向参量数据统一量纲的计算式为:

所述负向参量数据统一量纲的计算式为:

所述区间参量数据的统一量纲的计算式为:

其中,x

1.2对待选参量进行初步筛选

初步筛选的目标是筛选出对中小企业违约状态识别结果有显著影响的参量,此类参量在第一属性样本和整体样本中的平均秩次有着明显的区别,可以将第一属性样本与第二属性样本区分开来。首先针对单一待选参量关于每一个样本的定量数据进行排序,分配不同的秩。如对于待选参量i,在一个有m个第一属性样本和n个第二属性样本的群体中,按照参量值的大小为每一个样本分配一个秩,秩的值就是个体样本在升序排列中的顺序(如待选参量i相关的多个样本中值最小的个体的秩为1,值最大的个体的秩为m+n),因此每一个样本x

其中,τ

令W

对于第一属性样本而言,

为了进行统计检验,给出两个假设,如下所述:

假设H

H

为了进一步验证上述假设,本实施例定义了Z

对Z

分子的第一部分W

1.3基于秩相关分析的二次参量筛选

基于秩相关分析对参量进行二次筛选,去除重复参量。当两个待选参量之间存在相关关系时,去除Z值较小的参量,这样在精简参量的同时保留了重要参量。

为了计算两个参量之间的秩相关系数,分别按照参量k和l对于样本进行升序排列,排列结果为

定义d

根据如上定义,两个参量之间的秩相关系数γ

其中,

如果该秩相关系数超过判定值,则表明两个参量之间存在强相关关系,应该删除其中对违约状态影响较小的参量。

本实施例计算了第一参量集中两两之间的秩相关系数,并且移除了有相关关系的参量对中Z值较小的参量,从而确立最终的参量体系。进一步地,以该参量体系为输入,利用BP神经网络算法进行属性识别模型的训练。

2.中小企业属性识别模型训练

本实施例采用三层BP神经网络结构,分别为输入层、隐藏层和输出层。BP神经网络的主要操作原理为前向传播信号,反向传播误差,具体计算过程如下:

2.1前向传播

前向传播是指信号从输入层输入,经由隐藏层处理,最后由输出层输出的过程。其中,I

其中,V

其中,W

p=(O(V,W,b))

其中,T表示样本的实际违约情况(该变量有两种取值情况,1代表该企业不存在违约行为,0代表该企业存在违约情况)。当训练集中存在多个样本时,根据最大似然估计,就是让所有样本预测正确的概率相乘得到P,因此P的表达式为:

其中,Q代表训练集样本总量,p

在上式中,T

以上就是前向传播过程,并且将问题转化为误差函数最小化问题,接下来利用反向传播求解隐藏层和输出层的连接权重与偏置。

2.1反向传播

反向传播过程就是利用误差从输出层到隐藏层,最后到输入层,依次去调整各层的权重和偏置。如果误差超过预定值,误差进行后向反馈,利用梯度下降法对权重和偏置进行修改。ΔW

Δb

同样的,ΔV

另外,Δn

隐藏层和输出层的连接权重调整过程如式(20)、式(21)所示:

V

W

同样的隐藏层和输出层的偏置调整过程如式(22),式(23)所示:

b

b

最后,BP神经网络根据训练集的训练情况得到各层的权重以及偏置值,然后利用这些权重关系进行仿真,根据输入数据对样本状态进行预测。

3.示例分析

3.1样本和数据来源

为了验证基于区块链的智能交易主体属性识别模型的有效性和可行性,本示例利用一公司的区块链平台数据进行实证分析,该平台采取智能数据抓取以及中小企业自动上报的模式获取数据。本示例通过该平台获取了312家中小企业的相关数据,其中包括256家无失信信息的企业(下文称为正常企业)和56家有失信信息的企业(下文称为违约企业)。所有的数据信息如表1所示,该表格中数据分为两部分,第2行至第257行表示正常企业相关信息,第258行至末尾表示违约企业相关信息。每一行数据代表每家企业的具体参量信息,包括注册资本、实缴资本,股东旗下公司数目、专利数目、历史交易总额、库存价值等57个参量,并且最后一列用1和0来区分正常企业与违约企业,其中1表示正常企业,0表示违约企业。

表1

3.2建立违约状态属性识别参量体系

3.21参量数据标准化

为了去除参量单位、量纲和数据集不同所带来的影响,首先对各项参量进行标准化处理,处理结果如表2所示。

表2

3.22基于秩和校验的首次筛选

秩和校验的目标就是筛选出能够准确区分正常企业和违约企业的参量,去除多余重复的参量,为下一步秩相关分析奠定基础。比如实缴资本这一参量的Z

表3

3.23基于秩相关分析的二次筛选

为了进一步简化初级参量体系,利用秩相关分析删除相关性较高的参量。如对经营异常和行政处罚两个参量进行计算,秩相关系数为0.78,大于阈值0.6。因此对于检测样本而言,经营异常和行政处罚两个参量存在强相关性。另外根据秩和校验结果,保留两个参量中Z值较大的行政处罚参量。为了最大程度精简参量体系,加快后续神经网络收敛速度,本示例对所有参量进行秩相关分析。最终,移除10个参量,建立由24个参量组成的参量体系,具体如表4所示。

表4

3.3利用BP神经网络进行训练和违约状态识别

利用BP神经网络对中小企业进行违约状态识别,将企业样本随机划分为训练集与测试集,其中训练集占比为75%,测试集占比为25%。神经网络采用三层结构,其中输入层的节点个数由参量体系中的26个参量组成;隐藏层采用5个节点,并带有具备调节作用的偏置节点。

最后利用测试集进行测试,测试集包含78个样本,其中违约企业14家,正常企业64家。最终结果如表5所示,其中错误的将5家正常企业预测为违约企业,将2家违约企业误判为正常企业,其他样本预测正确,因此该测试集的准确率为91.03%。由结果可以判断,本算法能够达到90%以上的准确率,可以对信用不良企业进行较好甄别。

表5

3.4中小企业信用等级划分

根据基于区块链的主体属性识别模型,每一家企业都能得到相应的识别结果。本示例共识别了312家企业样本,并利用混合式算法对其进行评价打分,按结果从高到低依次排序,将排名前150的企业划分为信用A级,该等级说明企业信用良好;排名150~250的企业划分为B级,该等级说明企业信用中等;排名为250~300划分为C级,该等级说明企业信用偏低;排名末尾的企业划分为D级,该等级说明企业信用不良,在交易和融资过程中存在较大的违约风险。企业的信用划分为4个等级,具体划分标准如表6所示。

表6

综上所述,本发明所述智能交易主体属性识别模型训练方法、识别方法及装置,基于区块链交易平台中产生的数据进行分析,能够保障数据来源更可信。所述模型训练方法对每个待选参量对应的样本数据进行归一化处理后分配秩并修正得到相关秩,通过计算第一属性样本和整体样本间相关秩平均值的差,以分析每个待选参量在第一属性样本和整体样本中所呈现的差异性,其中,一待选参量在第一属性样本和整体样本间的相关秩平均值的绝对值越大则越能区分第一属性样本和第二属性样本。待选参量的筛选完全基于数据分析处理得到,并不引用任何经济规则,也不依赖人为主观判断,是完全客观的,具有较高的可信度和准确度。进一步地,基于大量现有数据对人工智能神经网络训练得到属性识别模型并用于识别,杜绝了认为主观因素的影响,使识别结果更加准确。

针对智能交易非面对面、虚拟性强以及动态变化的特点,本示例提出了基于区块链平台的智能交易主体属性识别模型,区块链技术保证链上数据的真实性与不可篡改性,基于秩和校验和BP神经网络的主体属性识别方法对主体进行识别,提高了识别准确性。

本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。

本发明中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号