技术领域
本发明属于计算机图算法领域,具体涉及一种金融股权知识大图的多层股权穿透方法,并应用于金融领域。
背景技术
金融股权知识大图本质上是大规模的金融股权知识图谱,蕴含了大量的语义信息与知识关联,由具有关联的结点与边组成。在金融股权知识大图中,每个结点表示金融机构或企业实体,每条边表示实体之间的持股或管理关系等。股权网络呈现出了股东来源众多且层层嵌套的复杂股权结构,股权结构是金融领域的一个重要特征,可以高效地从复杂股权网络中发现穿透式多层股权网络,识别出隐藏在层层股权网络之后的实际控股股东。
控股权为股东的持股份额达到可以控制公司的程度,并因此获得对公司支配和控制的权利,控股权分为绝对控股即持股比例超过50%和相对控股即持股比例低于50%但是可以实现有效持股。从表面上看大股东拥有着上市公司的控股权,但是只是其实际控股股东控股链路中的一环,受实际控股股东的影响。随着企业集团化模式的不断发展,企业与企业之间的关系变得更加复杂,实际控股股东被隐藏在层层股东之外,高杠杆的股权结构本身具有很大的风险。如何识别企业利用多层级复杂股权网络隐藏实际控股股东成为金融风险预警的关键。
目前为了计算外部股东对企业的最终持股比例,识别隐藏的实际控股股东,现有的方法主要采关系型数据库如MySQL进行数据存储,利用广度优先搜索算法(BFS算法)对股权网络进行遍历,直到找到所有的叶子结点,形成最终的股权网络子图。股权网络子图可以表示为邻接矩阵,Brioschi F等人提出Integrated Ownership Share(IOS)模型,通过稀疏矩阵运算,将持股比例向内反推,确定任意一个股东对一个金融机构或企业的最终持股比例,通过分析带有交叉持股的合法独立公司组成的股权网络,计算集团的公司的价值以及外部股东持有的综合所有权股份,并演绎了提高风险资本的过程与所有权从业务组的控制权分离之间的联系。根据IOS模型得到的最终持股比例即可确定实际控股股东。
目前缺乏从知识关联角度发现和分析金融风险结构的工作,不能对全量的股权网络进行穿透式股权结构发现。随着企业数量的快速增长,构建的金融股权知识大图达到了亿级规模,现有的持股比例计算模型,时间复杂度较高,难以支持大规模金融股权知识大图的查询与分析。因此本发明的创新点为:
基于知识关联将金融机构、非金融机构及其之间的股权关系统一组织和表示为一个金融股权知识大图,将金融股权网络中关键风险特征结构发现的问题转化为金融股权知识大图中的知识关联发现问题。
提出具有更高时间效率的查询分析算法,通过一次遍历即可确定企业的股东层级与最终持股比例,识别实际控股股东,高效地支持亿级三元组金融股权知识大图中金融机构之间的穿透式多层股权网络查询与分析。
发明内容
有鉴于此,本发明要解决的技术问题是:提供一种复杂的增量股权计算的遍历算法,能够准确高效地找出金融股权知识大图中给定金融机构为中心的穿透式多层股权网络,识别出中心结点的实际控股股东。
本发明为解决上述技术问题所采取的技术方案为一种金融股权知识大图的多层股权穿透方法,其特征在于,包括以下步骤:
步骤1:通过多个结点、多条边以及边上的权重构建金融股权知识大图;
步骤1所述金融股权知识大图为:
G(V,E)
V={v
其中,V表示金融股权知识大图中结点集合,E表示金融股权知识大图中边的集合,K表示金融股权知识大图中结点的数量即|V|=K,v
步骤2:在步骤1所述金融股权知识大图中随机选取任意一个非孤立结点作为中心结点,中心结点在步骤1所述金融股权知识大图中通过广度优先遍历算法处理得到中心结点的多个一阶邻居结点,根据中心结点及中心结点的多个一阶邻居结点构建单阶穿透式多层股权网络;
步骤2所述任意一个结点定义为:第i个中心结点即v
步骤2所述中心结点的多个一阶邻居结点集合定义为:
步骤2所述的邻居结点定义为:
步骤2所述一阶邻居结点则表示为:
步骤3:在步骤2所述单阶穿透式多层股权网络中,构建中心结点与每个一阶邻居结点的持股路径集合,计算每个一阶邻居结点与中心结点的最终持股比例;
步骤3所述的单条持股路径表示为:
p= 其中,v 路径p上的股权比例乘积作为该条路径的股权比例:
步骤3所述中心结点v 步骤3所述中心结点v
i∈[1,K],j∈[1,D] 其中,K表示金融股权知识大图中结点的数量,N为中心结点与中心结点的j个一阶邻居结点的路径数量, 步骤3所述中心结点与中心结点的第j个一阶邻居结点的最终持股比例为:
其中, 步骤4:在步骤2所述单阶穿透式多层股权网络中通过对数转换边上的权重即股权比例,计算邻居结点到中心结点所有持股路径的转换股权比例,选取最小的转换股权比例作为该结点到中心结点的一阶最大持股路径转换股权比例; 步骤4所述的转换边上的权重的函数为:
其中 步骤4中所述邻居结点到中心结点单条持股路径的转换股权比例为:
其中,U为路径的长度; 步骤4所述一阶的最大持股路径转换股权比例计算公式:
其中, 步骤5:将步骤4所述的最大持股路径转换股权比例所在的路径的跳数,作为该结点最终的层级 步骤5中我们定义遍历的阶数为h,当前遍历为一阶,因此h=1,邻居结点
步骤5所述的函数特征为:
其中 步骤6:将最外层的结点作为下一次遍历的开始结点,进一步查找最外层结点的入度相邻结点,构建多阶穿透式多层股权网络; 步骤6所述的最外层结点定义为: 其中,h表示当前遍历的阶数,h≥2; 步骤6所述的最外层结点 步骤7:在步骤6所述的多阶穿透式多层股权网络中,依次计算当前穿透式多层股权网络中每一个最外层结点到中心结点的最终持股比例;通过最外层结点到其出度邻居结点的持股比例乘以其邻居结点的前一阶层的最终持股比例,得到最外层结点到中心结点的当前阶层的最终持股比例,所有阶层最终持股比例的累加得到最外层结点的最终持股比例; 步骤7所述的最外层结点定义为: 步骤7所述最外层结点出度的邻居结点定义为: 步骤7所述的中心结点与中心结点的第j个h阶邻居结点的h阶最终持股比例为:
其中,R为最外层结点 步骤7所述的最外层结点的最终持股比例等于各阶层相同结点的所属阶层的最终持股比例的累加和,计算公式为:
其中,当最外层结点处于多个阶层时,例如v 步骤7所述的最终持股比例针对穿透式多层股权网络中无环路的点,如果遇到带环路的点则仅针对带环路点转到步骤8; 步骤8:在步骤6所述的多阶穿透式多层股权网络中,如果遇到结点处于环路之中,需要计算修正系数c,计算结点到中心结点v 步骤8所述的环路结点集合定义为V 步骤8所述的修正系数计算公式为:
其中, 步骤8所述的环路的最终持股比例计算公式为:
其中, 步骤9:在步骤7所述的多阶穿透式多层股权网络中,最外层结点到中心结点v 步骤9中所述的最外层结点为 步骤9中所述的最大持股路径转换股权比例计算公式为:
其中, 步骤10:将步骤9所述的最大持股路径转换股权比例 步骤10中所述结点
步骤11:h=2,重复调用步骤6-10,每调用一轮之后h+1,直到当前最外层结点没有叶子结点为止,停止遍历,得到最终的穿透式多层股权网络,当叶子结点的最终持股比例最大的结点即为该中心结点的实际控股股东; 步骤11中穿透式多层股权网络的最外层的叶子结点集合表示为:V 步骤11中所述的实际控股股东V 其中,最大最终持股比例
其中, 与现有方法相比,本发明所公开的一种基于金融股权知识大图的多层股权穿透方法,具有如下的有益效果: 采用知识图谱技术,对金融行业错综复杂的结构化信息与丰富的语义信息融合,生成金融股权知识大图,并结合语义信息为识别实际控股股东提供一种高效算法; 采用优化技术,在查询过程中仅需要一次遍历就可以确定层级与最终持股比例,并支持带环路一般路径的穿透,具有较强的适用性; 具有更低的时间复杂度,随着查询股权层数的增加,查询时间增长率明显低于现有算法,并具有更强的可扩展性,能够支持大数据环境下的金融股权知识大图的穿透式多层股权网络的查询与分析,有效识别实际控股股东。 附图说明 附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。 图1:为本发明方法流程图。 图2:为本发明一实施例提供的金融股权知识大图示意图。 图3:为本发明一实施例提供的带环路的金融股权知识大图示意图。 具体实施方式 下面结合具体实例和附图1-3对本发明做进一步说明。 本发明提供一种基于金融股权知识大图的多层股权穿透方法,如图1所示,本方法包括以下步骤: 步骤1:通过多个结点、多条边以及边上的权重构建金融股权知识大图; 步骤1所述金融股权知识大图为: G(V,E) V={v
其中,V表示金融股权知识大图中结点集合,E表示金融股权知识大图中边的集合,K=60,599,124表示金融股权知识大图中结点的数量即|V|=K,v 步骤2:在步骤1所述金融股权知识大图中随机选取任意一个非孤立结点作为中心结点,中心结点在步骤1所述金融股权知识大图中通过广度优先遍历算法处理得到中心结点的多个一阶邻居结点,根据中心结点及中心结点的多个一阶邻居结点构建单阶穿透式多层股权网络; 步骤2所述任意一个结点定义为:第i个中心结点即v 步骤2所述中心结点的多个一阶邻居结点集合定义为:N 步骤2所述的邻居结点定义为: 步骤2所述一阶邻居结点则表示为: 步骤3:在步骤2所述单阶穿透式多层股权网络中,构建中心结点与每个一阶邻居结点的持股路径集合,计算每个一阶邻居结点与中心结点的最终持股比例; 步骤3所述的单条持股路径表示为为: p= 其中,v 路径p上的股权比例乘积作为该条路径的股权比例:
步骤3所述中心结点v 步骤3所述中心结点v
i∈[1,K],j∈[1,D] 其中,K表示金融股权知识大图中结点的数量,N为中心结点与中心结点的j个一阶邻居结点的路径数量, 步骤3所述中心结点与中心结点的第j个一阶邻居结点的最终持股比例为:
其中, 步骤4:在步骤2所述单阶穿透式多层股权网络中通过对数转换边上的权重即股权比例,计算邻居结点到中心结点所有持股路径的转换股权比例,选取最小的转换股权比例作为该结点到中心结点的一阶最大持股路径转换股权比例; 步骤4所述的转换边上的权重的函数为:
其中 步骤4中所述邻居结点到中心结点单条持股路径的转换股权比例为:
其中,U为路径的长度; 步骤4所述一阶的最大持股路径转换股权比例计算公式:
其中, 步骤5:将步骤4所述的最大持股路径转换股权比例所在的路径的跳数,作为该结点最终的层级 步骤5中我们定义遍历的阶数为h,当前遍历为一阶,因此h=1,邻居结点
步骤5所述的函数特征为:
其中 步骤6:将最外层的结点作为下一次遍历的开始结点,进一步查找最外层结点的入度相邻结点,构建多阶穿透式多层股权网络; 步骤6所述的最外层结点定义为: 其中,h表示当前遍历的阶数,h≥2; 步骤6所述的最外层结点 步骤7:在步骤6所述的多阶穿透式多层股权网络中,依次计算当前穿透式多层股权网络中每一个最外层结点到中心结点的最终持股比例;通过最外层结点到其出度邻居结点的持股比例乘以其邻居结点的前一阶层的最终持股比例,得到最外层结点到中心结点的当前阶层的最终持股比例,所有阶层最终持股比例的累加得到最外层结点的最终持股比例; 步骤7所述的最外层结点定义为: 步骤7所述最外层结点出度的邻居结点定义为: 步骤7所述的中心结点与中心结点的第j个h阶邻居结点的h阶最终持股比例为:
其中,R为最外层结点 步骤7所述的最外层结点的最终持股比例等于各阶层相同结点的所属阶层的最终持股比例的累加和,计算公式为:
其中,当最外层结点处于多个阶层时,例如v 步骤7所述的最终持股比例针对穿透式多层股权网络中无环路的点,如果遇到带环路的点则仅针对带环路点转到步骤8; 步骤8:在步骤6所述的多阶穿透式多层股权网络中,如果遇到结点处于环路之中,需要计算修正系数c,计算结点到中心结点v 步骤8所述的环路结点集合定义为V 步骤8所述的修正系数计算公式为:
其中, 步骤8所述的环路的最终持股比例计算公式为:
其中, 步骤9:在步骤7所述的多阶穿透式多层股权网络中,最外层结点到中心结点v 步骤9中所述的最外层结点为 步骤9中所述的最大持股路径转换股权比例计算公式为:
其中, 步骤10:将步骤9所述的最大持股路径转换股权比例 步骤10中所述结点
步骤11:h=2,重复调用步骤6-10,每调用一轮之后h+1,直到当前最外层结点没有叶子结点为止,停止遍历,得到最终的穿透式多层股权网络,当叶子结点的最终持股比例最大的结点即为该中心结点的实际控股股东; 步骤11中穿透式多层股权网络的最外层的叶子结点集合表示为:V 步骤11中所述的实际控股股东V 其中,最大最终持股比例
其中, 总体算法如下:
具体实施例如下: 如图2金融股权知识大图所示,图中各个边上的标注为该边对应的持股关系,图中下方为各个持股关系的持股比例以及对持股比例进行对数转换之后的权重。选择结点v 对于金融股权知识大图中存在持股环路的情况,如图3所示,结点v 本发明提出的金融股权知识大图中的多层股权穿透方法,解决复杂增量股权计算问题,应用于金融股权知识大图,能够从复杂股权知识关联中发现穿透式多层股权网络,识别出隐藏在层层股权网络之后的实际控股股东。 以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。
机译: 股权投资信托管理系统,股权投资信托管理方法,程序
机译: 通过低息资本成长指数股权抵押向资产所有者释放股权的方法
机译: 股权或与之相关的改进和制作所述股权的方法。