法律状态公告日
法律状态信息
法律状态
2019-10-01
授权
授权
2016-11-09
实质审查的生效 IPC(主分类):G06Q10/06 申请日:20160516
实质审查的生效
2016-10-12
公开
公开
技术领域
本发明属于网络技术领域,尤其涉及一种基于采购数据的企业自我网络关系圈划分方法及服务器。
背景技术
随着“互联网+”发展战略的不断深入,企业经营体现出越来越多的分散化、网络化特征,企业网络规模越来越大,节点形式和类型越来越多样,其复杂性、动态性特征越来越明显。企业网络中以企业为节点,以企业之间的关系为边。社交网络和大数据技术的迅速发展,为人们解决复杂网络分析问题提供了有效的工具。将社交网络的研究思路应用于企业网络,进行构造互联网企业网络,在社交网络时代和数字化企业时代,都有着重要意义。
企业关系作为传递信息的关键纽带,在企业业务活动中扮演着无可替代的角色。企业关系网是一种以企业为基本单元,与企业伙伴、供应商、分销商、业务外包提供者,甚至竞争对手等,在实际业务活动中所建立的各种关系共同构成的网络。企业可以与不同行业、不同领域的企业或组织建立关系,其关系发生条件以实际业务的发生(订单、服务或资金)等的存在为前提,因此是一种真实的关系,具有重要的价值。企业网络是指由一组自主独立而且相互关联的企业及各类机构为了共同的目标,依据专业化分工和协作建立的一种长期性的企业间的联合体。企业网络关系包括竞争、产品供应、同质以及潜在供应关系。
由于每个企业开展业务多从企业本身的自我视角出发,分析一个企业的自我网络具有更现实的意义;比如,汽车工业是一个复杂的网络,在原料供应商,二级部件供应商,一级部件供应商,汽车制造商,分销商,顾客所构成的网络中,汽车制造商一般都是处于核心企业的地位。其中,自我网络(ego network)指环绕在自我(ego)周围的社会网络,它既包括ego与直接相连节点(alter)的链接,也包括这些alter节点之间的链接。结合网络结构特征和用户描述信息,对社交网络中的自我网络进行自动划分,得到了中心用户不同的社交圈子。
传统划分方法的可靠性极大的依赖于评价指标体系的建立,但是不恰当的评价指标会极大的影响与供应商关系紧密度的判断。传统方法的评价指标可以通过查询业务记录、发放调查问卷、重要事件记录等方法来获得,整个过程需要信息采集员来进行相关资料的搜集,这个过程是比较繁琐的。同时分析员进行分析和打分时,容易产生人为主观上的误差。此外,针对企业订单数据,传统方法针对每个等级设定阈值,从而确定每个等级中的供应商。这样的机械切分方法存在主观性,并不能反映各个等级内供应商的真实分布,故导致划分结果不准确。
因此,亟需一种操作简便,数据精确,便于展示的基于采购数据的企业自我网络关系圈划分方法及服务器。
发明内容
为了解决现有技术的缺点,本发明提供一种操作简便,数据精确,便于展示的基于采购数据的企业自我网络关系圈划分方法及服务器。
为实现上述目的,本发明采用以下技术方案:
一种基于采购数据的企业自我网络关系圈划分方法,包括:
步骤(1):获取企业相关信息来构建企业网络,并以图的结构形式存储至数据库中;所述企业相关信息包括企业属性信息、企业间采购订单数量及企业间供应关系信息;
步骤(2):从数据库存储的企业网络中,选定一个企业为中心企业,查找该中心企业的所有供应商企业来构建该中心企业的自我网络;其中,该中心企业的自我网络每条边的权重是相应边上两个企业间的采购订单数量;
步骤(3):从中心企业的自我网中,获取中心企业的所有供应商总和以及中心企业与所有供应商之间的采购订单数量,绘制以中心企业与供应商之间的采购订单数量为变量的双对数模式下的CCDF曲线;
步骤(4):通过计算CCDF曲线中各个点之间的斜率和查找最小极差的方法,确定CCDF曲线的最优分割点,并将CCDF曲线上最优分割点的不同分割段内的供应商企业采用不同颜色进行标注,最终实现企业自我网络关系圈划分。
所述步骤(1)中,以企业为节点,根据企业间供应关系信息,构建出企业网络。
所述步骤(2)中,根据企业网络在数据库中的图的结构,以中心企业为起点对企业网络进行遍历,查找所述中心企业的所有供应商企业,并存储至供应商集合中。
以中心企业为起点,分别调取供应商集合中的供应商并作为终点,构建出以中心企业为中心的有向图结构,进而得到中心企业的自我网络。
在所述步骤(4)中对CCDF曲线进行分割的过程中,首先,计算CCDF曲线中所有相邻两点之间的斜率,得到斜率序列;
根据斜率序列,计算CCDF曲线上任意两点间的极差;CCDF曲线上任意两点间的极差等于这两点之间所有线段中斜率最大值与最小值之差;
使用递归算法来计算CCDF曲线的每一种分割相对应的极差和,并将相对应的极差和存储至极差和集合中;
遍历极差和集合,查找极差和最小值;其中,极差和最小值对应的CCDF曲线上的分割点为CCDF曲线的最优分割点。
一种用于企业自我网络关系圈划分的服务器,包括:
企业网络构建模块,其被配置为获取企业相关信息来构建企业网络,并以图的结构形式存储至数据库中;所述企业相关信息包括企业属性信息、企业间采购订单数量及企业间供应关系信息;
自我网络构建模块,其被配置为从数据库存储的企业网络中,选定一个企业为中心企业,查找该中心企业的所有供应商企业来构建该中心企业的自我网络;其中,该中心企业的自我网络每条边的权重是相应边上两个企业间的采购订单数量;
CCDF曲线绘制模块,其被配置为从中心企业的自我网中,获取中心企业的所有供应商总和以及中心企业与所有供应商之间的采购订单数量,绘制以中心企业与供应商之间的采购订单数量为变量的双对数模式下的CCDF曲线;
CCDF曲线分割模块,其被配置为通过计算CCDF曲线中各个点之间的斜率和查找最小极差的方法,确定CCDF曲线的最优分割点,并将CCDF曲线上最优分割点的不同分割段内的供应商企业采用不同颜色进行标注,最终实现企业自我网络关系圈划分。
所述企业网络构建模块中,企业网络是以企业为节点,根据企业间供应关系信息而构建。
所述自我网络构建模块,还包括:供应商企业查找模块,其用于根据企业网络在数据库中的图的结构,以中心企业为起点对企业网络进行遍历,查找所述中心企业的所有供应商企业,并存储至供应商集合中。
所述自我网络构建模块,还包括有向图结构构建模块,其用于以中心企业为起点,分别调取供应商集合中的供应商并作为终点,构建出以中心企业为中心的有向图结构。
所述CCDF曲线分割模块,包括:
斜率序列计算模块,其被配置为计算CCDF曲线中所有相邻两点之间的斜率,得到斜率序列;
极差计算模块,其被配置为根据斜率序列,计算CCDF曲线上任意两点间的极差;CCDF曲线上任意两点间的极差等于这两点之间所有线段中斜率最大值与最小值之差;
极差和计算模块,其被配置为使用递归算法来计算CCDF曲线的每一种分割相对应的极差和,并将相对应的极差和存储至极差和集合中;
最优分割点确定模块,其被配置为遍历极差和集合,查找极差和最小值;其中,极差和最小值对应的CCDF曲线上的分割点为CCDF曲线的最优分割点。
本发明的基于采购数据的企业自我网络关系圈划分方法,在企业网络的基础上,基于采购数据,最终可以得到企业自我网络中的供应商等级,本发明排除了主观判断与机械切分的弊端,与现有的划分技术相比较,该方法具有以下优势:
(1)本发明以订单数据为基础,划分结果比较可靠;一个供应商获得订单数量可以直接反映出与制造商的业务紧密度,与其他数据相比,订单数据简单、可靠和直观;
(2)等级划分没有歧义,不存在人为主观误差。利用双对数模式下的CCDF曲线对供应商圈子进行划分,可以直接进行直线段的拆分,也可以利用斜率算法对其划分,划分过程简洁、直观。其中,本发明利用双对数模式下的CCDF曲线划分供应商等级的理论依据是Pareto分布。该理论描述了自然界和人类社会尤其是经济领域较为常见的各种现象,所以本方法的划分结果是可信任和具有参考意义的。
(3)本发明还将不同的企业自我网络关系圈结合企业网络进行展示,将不同的企业自我网络关系圈中供应商企业设为不同的颜色,更加直观地查看划分结果。
附图说明
图1是本发明的基于采购数据的企业自我网络关系圈划分方法的流程示意图;
图2是本发明的分割后的CCDF曲线示意图;
图3是本发明的用于企业自我网络关系圈划分服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例中基于采购数据的企业自我网络关系圈划分方法的流程示意图,如图所示本实施例中的基于采购数据的企业自我网络关系圈划分方法包括:
步骤(1):获取企业相关信息来构建企业网络,并以图的结构形式存储至数据库中;所述企业相关信息包括企业属性信息、企业间采购订单数量及企业间供应关系信息;
步骤(2):从数据库存储的企业网络中,选定一个企业为中心企业,查找该中心企业的所有供应商企业来构建该中心企业的自我网络;其中,该中心企业的自我网络每条边的权重是相应边上两个企业间的采购订单数量;
步骤(3):从中心企业的自我网中,获取中心企业的所有供应商总和以及中心企业与所有供应商之间的采购订单数量,绘制以中心企业与供应商之间的采购订单数量为变量的双对数模式下的CCDF曲线;
步骤(4):通过计算CCDF曲线中各个点之间的斜率和查找最小极差的方法,确定CCDF曲线的最优分割点,并将CCDF曲线上最优分割点的不同分割段内的供应商企业采用不同颜色进行标注,最终实现企业自我网络关系圈划分。
具体实现中,步骤(1)中,以企业为节点,根据企业间供应关系信息,构建出企业网络。
在具体实施例过程中,根据爬取到的企业网络数据构建一张有向图。Neo4j是一种图数据库,采用Neo4j保存和处理图数据,可以提高数据处理的速度。采用Cypher语言进行数据库查询和操作。构造企业网络主要是对点和边的建立,包括以下步骤:
1)企业结点建立。从爬取到的数据中将每个企业取出,将其作为一个企业结点(标签为Enterprise),按如下Cypher语句插入到Neo4j中。
Cypher语句:create(n:Enterprise{id:’企业id’,mc:’企业mc’,qt:’其他企业属性’})
2)企业之间关系边的建立。从爬取到的数据中将每条关系取出,分别得到供应商gid和制造商zid。按如下Cypher语句建立供应关系(标签为Supply_to):
Cypher语句:match(n:Enterprise{id:’gid’}),(m:Enterprise{id:’zid’})createn-[:Supply_to]->m。
具体实现中,步骤(2)中,根据企业网络在数据库中的图的结构,以中心企业为起点对企业网络进行遍历,查找所述中心企业的所有供应商企业,并存储至供应商集合中。
以中心企业为起点,分别调取供应商集合中的供应商并作为终点,构建出以中心企业为中心的有向图结构,进而得到中心企业的自我网络。
具体实施例过程中,给定要分析的企业zid,将与该企业相关的所有供应商查找出来,并将边的权重设为供应商获得的订单数目orderNum。
自我网络获取:
Cypher语句:match(n:Enterprise{id:’zid’})<-[r:Supply_to]-(m:Enterprise)return n,m,r
边权重设置:
Cypher语句:match(n:Enterprise{id:’zid’})<-[r:Supply_to]-(m:Enterprise{id:’gid’})setr.orderNum=orderNum。
步骤(3)的具体实现过程为:
步骤(3.1):按照如下方法计算双对数模式下CCDF曲线上的每一个点(x,y):从中心企业自我网络中得到供应商及其订单数目。
步骤(3.2):计算供应商总数gysNum;按照订单数目x,统计拥有此订单数目的供应商的数量,然后除以供应商总数即得所占比例,记为m。并且按照订单数目从小到大顺序进行排列。
Cypher语句:
Cypher语句:match(n:Enterprise{id:’zid’})<-[r:Supply_to]-(k:Enterprise)return r.orderNumas x,count(distinct k)/gysNum as m order by x;
根据排序好的序列,计算每一个点相应的y值:
计算点序列(x,y),(x,y)表示拥有超过订单数x的供应商所占的比例为y;
for i=2:gysNum,//令y[1]=1,针对已经排序的(x,m)序列进行如下循环
y[i]=y[i-1]-m[i-1];
end
步骤(3.3):针对每个点(x,y)分别取log,作为新的点。
x=log(x);y=log(y)
步骤(3.4):最终获得双对数模式下CCDF图线的每个点(x,y),可以通过曲线展示出来。
具体实现中,在步骤(4)中对CCDF曲线进行分割的过程中,首先,计算CCDF曲线中所有相邻两点之间的斜率,得到斜率序列;
根据斜率序列,计算CCDF曲线上任意两点间的极差;CCDF曲线上任意两点间的极差等于这两点之间所有线段中斜率最大值与最小值之差;
使用递归算法来计算CCDF曲线的每一种分割相对应的极差和,并将相对应的极差和存储至极差和集合中;
遍历极差和集合,查找极差和最小值;其中,极差和最小值对应的CCDF曲线上的分割点为CCDF曲线的最优分割点。
如图2所示,本实施例中CCDF曲线的最优分割点为3个,将CCDF曲线分成了Part1、Part2、Part3和Part4这四段。
经过上述步骤,构造了一个企业的自我网络,并且对其进行圈子划分,得到了各个圈子内的供应商。按照各个圈子中供应商订单数多少排序,可以分为1、2…K级供应商,其中,K为大于等于1的正整数。可以结合Neo4j对不同的供应商等级圈子进行展示,主要是给不同等级的供应商标记为不同的标签从而进行可视化展示。
Cypher语句如下:
Cypher语句:match(m:Enterprise{id:’gid’})set m:(1/2/3-classSupplier)
给不同等级的供应商打上不同的标签后,可以根据标签的不同设置不同的节点显示颜色,从而更好的显示供应商的等级。
本发明以订单数据为基础,划分结果比较可靠。一个供应商获得订单数量可以直接反映出与制造商的业务紧密度,与其他数据相比,订单数据简单、可靠和直观;
等级划分没有歧义,不存在人为主观误差。利用双对数模式下的CCDF曲线对供应商圈子进行划分,可以直接进行直线段的拆分,也可以利用斜率算法对其划分,划分过程简洁、直观。其中,本发明利用双对数模式下的CCDF曲线划分供应商等级的理论依据是Pareto分布。该理论描述了自然界和人类社会尤其是经济领域较为常见的各种现象,所以本方法的划分结果是可信任和具有参考意义的。
如图3所示,本发明的用于企业自我网络关系圈划分的服务器,包括:
企业网络构建模块,其被配置为获取企业相关信息来构建企业网络,并以图的结构形式存储至数据库中;所述企业相关信息包括企业属性信息、企业间采购订单数量及企业间供应关系信息;
自我网络构建模块,其被配置为从数据库存储的企业网络中,选定一个企业为中心企业,查找该中心企业的所有供应商企业来构建该中心企业的自我网络;其中,该中心企业的自我网络每条边的权重是相应边上两个企业间的采购订单数量;
CCDF曲线绘制模块,其被配置为从中心企业的自我网中,获取中心企业的所有供应商总和以及中心企业与所有供应商之间的采购订单数量,绘制以中心企业与供应商之间的采购订单数量为变量的双对数模式下的CCDF曲线;
CCDF曲线分割模块,其被配置为通过计算CCDF曲线中各个点之间的斜率和查找最小极差的方法,确定CCDF曲线的最优分割点,并将CCDF曲线上最优分割点的不同分割段内的供应商企业采用不同颜色进行标注,最终实现企业自我网络关系圈划分。
其中,在企业网络构建模块中,企业网络是以企业为节点,根据企业间供应关系信息而构建。
自我网络构建模块,还包括:供应商企业查找模块,其用于根据企业网络在数据库中的图的结构,以中心企业为起点对企业网络进行遍历,查找所述中心企业的所有供应商企业,并存储至供应商集合中。
自我网络构建模块,还包括有向图结构构建模块,其用于以中心企业为起点,分别调取供应商集合中的供应商并作为终点,构建出以中心企业为中心的有向图结构。
其中,CCDF曲线分割模块,包括:
斜率序列计算模块,其被配置为计算CCDF曲线中所有相邻两点之间的斜率,得到斜率序列;
极差计算模块,其被配置为根据斜率序列,计算CCDF曲线上任意两点间的极差;CCDF曲线上任意两点间的极差等于这两点之间所有线段中斜率最大值与最小值之差;
极差和计算模块,其被配置为使用递归算法来计算CCDF曲线的每一种分割相对应的极差和,并将相对应的极差和存储至极差和集合中;
最优分割点确定模块,其被配置为遍历极差和集合,查找极差和最小值;其中,极差和最小值对应的CCDF曲线上的分割点为CCDF曲线的最优分割点。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
机译: 互联网(万维网,“ www”)基于客户/实体定义的标准,零售或以其他方式按规则的时间增量(带有推送通知)定制时间刮取/采购服务。适用于www上任何有形或无形的可购买或免费项目。包括对付费用户(即企业)的输出/市场需求数据和//报告。后端代码,网站功能,相同功能的应用程序(iOS,Android)以及相关浏览器附加服务的自动自定义标准网络抓取方法的方法的专利。
机译: 社交网络关系信息提供服务器,用于跟踪和提供从市场平台和内容平台接收的数据的社交网络关系,以基于成员在服务环境中制作社交图,其信息提供方法
机译: 社交网络关系信息提供服务器,用于跟踪和提供从市场平台和内容平台接收的数据的社交网络关系,以基于成员在服务环境中制作社交图,其信息提供方法