首页> 中国专利> 一种推测复杂系统中节点之间隐含关系的方法

一种推测复杂系统中节点之间隐含关系的方法

摘要

本发明提出了一种推测复杂系统中节点之间隐含关系的方法,包括:构建复杂系统中的节点和节点之间的作用关系;查找具有关系源头特征的节点,作为祖代节点,将所述祖代节点构成祖代集合;对所述祖代集合中的每个祖代节点查找对应的子代节点,构成子代集合;对所述子代集合中的每个子代节点查找对应的孙代节点,构成孙代集合;构成家族集合;获取家族集合的基因序列;获取所有待比较节点的基因序列,将每个待比较节点的基因序列与所述家族集合的基因序列进行对比,筛选出最终的隐含关系节点。

著录项

  • 公开/公告号CN112988793A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利号CN202110477837.5

  • 发明设计人 辛柯俊;王帆;候军;查道龙;

    申请日2021-04-30

  • 分类号G06F16/245(20190101);G06F16/28(20190101);G06N3/12(20060101);

  • 代理机构32534 南京新众合专利代理事务所(普通合伙);

  • 代理人彭雄

  • 地址 210000 江苏省南京市江宁区科学园诚信大道2069号(江宁高新园)

  • 入库时间 2023-06-19 11:29:13

说明书

技术领域

本发明涉及复杂系统技术领域,特别涉及一种推测复杂系统中节点之间隐含关系的方法。

背景技术

随着社会的发展,各类社会关系也越来越复杂,例如人脉关系、蚂蚁社群等。基于此,将技术、人物、组织、资本、政策、自然资源等宇宙万物可以分别看作节点,然后将这些节点数量巨大且相互关系错综的庞大内容链,构成一个复杂的系统。但是由于节点数量多、关系复杂,导致很难对相距较远的节点之间的隐含关系进行推测。例如,针对产业园区中的多个企业或者高校的专家,如何推测这些节点之间的隐含关系,从而为政府或企业、个人精准推送满足其需求的推荐内容,是当前需要解决的技术问题之一。

发明内容

本发明的目的旨在至少解决所述技术缺陷之一。

为此,本发明的目的在于提出一种推测复杂系统中节点之间隐含关系的方法。

为了实现上述目的,本发明提供一种推测复杂系统中节点之间隐含关系的方法,包括如下步骤:

步骤S1,构建复杂系统中的节点和节点之间的作用关系;

步骤S2,在所述复杂系统中,查找具有关系源头特征的节点,作为祖代节点,并为每个所述祖代节点进行赋值,将所述祖代节点构成祖代集合;

步骤S3,根据所述复杂系统中的节点之间的作用关系,对所述祖代集合中的每个祖代节点查找对应的子代节点,并根据所述子代节点的重合次数进行赋值,将所述子代节点构成子代集合;

步骤S4,根据所述复杂系统中的节点之间的作用关系,对所述子代集合中的每个子代节点查找对应的孙代节点,并根据所述孙代节点的重合次数进行赋值,将所述孙代节点构成孙代集合;

步骤S5,将得到的所述祖代集合、子代集合和孙代集合,进行去重,并对相同节点的得分进行累积相加,根据最终的节点和赋值得分,构成家族集合;

步骤S6,对所述家族集合进行分析,对子代节点和孙代节点根据得分高低进行排序,根据排序结果选择得分大于1且排名为前N名的节点作为频率高出现的节点,判断这些节点与祖代节点之间存在隐含关系,且这些节点之间也存在隐含关系;

步骤S7,获取家族集合的基因序列,其中,每个所述节点均包括一个或多个表示特征的基因单元,以及所述基因单元之间的连接关系,根据该节点的赋值得到对其所对应的每个基因单元进行加权得分,然后将所有节点中每组相同类型的基因单元进行相加合并,且保持已有连接关系不变,得到该家族集合的基因序列;

步骤S8,获取所有待比较节点的基因序列,将每个待比较节点的基因序列与所述家族集合的基因序列进行对比,计算该待比较节点与作为基准的家族集合的基因序列的相似度值,然后对所有待比较节点按相似度值从高到低进行排序,然后按照预设的筛选条件,从排序结果中筛选出最终的隐含关系节点。

进一步,在所述步骤S3中,在对祖代节点查找子代节点的过程中,针对查找到的子代节点,每查找到一次则计1分,对同时属于多个祖代节点的子代节点,根据重复出现次数累积加分赋值。

进一步,在所述步骤S4中,在对子代节点查找孙代节点的过程中,针对查找到的孙代节点,每查找到一次则计1分,对同时属于多个子代节点的孙代节点,根据重复出现次数累积加分赋值。

进一步,在所述步骤S7中,采用组成该节点名称的一个或多个词语,表示该节点的基因单元。

进一步,在所述步骤S8中,所述计算该待比较节点与作为基准的家族集合的基因序列的相似度值,包括如下步骤:

步骤S81:对待比较节点中的每个基因单元,在所述家族集合的基因序列中进行搜索,如果存在匹配,则将匹配基因单元在基因序列图中的赋值得分记录到变量s中,以此类推,对每个基因单元进行匹配计算,得到最终累计的变量s值;

步骤S82:获取待比较节点中基因单元之间的连接关系,在所述家族集合的基因序列中进行搜索,如果存在匹配的连接关系,则记录变量t值为1,以此类推,对每组连接关系进行匹配计算,得到最终累计的变量t值。

进一步,在所述步骤S8中,所述预设的筛选条件包括:选择排序在前的预设比例范围内的节点或者变量m的值大于预设值的节点,作为隐含关系节点。

根据本发明的推测复杂系统中节点之间隐含关系的方法,具有逻辑清晰、运算简单,没有浮点运算,对算力要求很低的特点。本发明可以非常广泛地应用在复杂系统图计算场景,在已知部分连接的前提下,非常快速便捷地推测隐含连接,为各类企业园区或政府、高校机构提供精准内容推荐的技术支持。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点结合下面附图对实施例的描述将变得更加明显和容易理解,其中:

图1为根据本发明实施例的推测复杂系统中节点之间隐含关系的方法的流程图;

图2为根据本发明实施例的复杂系统的节点连线示意图;

图3为根据本发明实施例的祖代节点的连线示意图;

图4为根据本发明实施例的子代节点的连线示意图;

图5为根据本发明实施例的孙代节点的连线示意图;

图6为根据本发明实施例的隐含关系节点的连线示意图;

图7为根据本发明实施例的家族集合的基因序列图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本发明提供一种推测复杂系统中节点之间隐含关系的方法。下面先对“隐含关系”进行说明:根据事物普遍联系原理,除了实际连线表达的关系之外,单元之间应该还存在更多的关系,由于图中没有实际连线表达,称之为“隐含关系”。如图2所示,例如,给定1号节点,进一步想知道给定点除了与12号节点相连之外,还有可能与哪些节点存在隐含关系。如何得到节点之间的隐含关系,就是本发明要解决的技术问题。

如图1所示,本发明实施例的推测复杂系统中节点之间隐含关系的方法,包括如下步骤:

步骤S1,构建复杂系统中的节点和节点之间的作用关系,参考图2。

步骤S2,在复杂系统中,查找具有关系源头特征的节点,作为祖代节点,并为每个祖代节点进行赋值,将祖代节点构成祖代集合。

在本发明中,可以采用通用的词向量法、编辑距离法等方法进行节点处理,针对节点的名称或描述,或名称+描述都可以。只需要在整个计算过程中采用前后一致的处理即可。

下面结合图3至图6对本发明的推测复杂系统中节点之间隐含关系的方法进行说明。其中,对图3至图6的标注说明如下:无外圈黑底节点为祖代节点;单外圈白底节点为子代节点;双外圈白底节点为孙代节点。

参考图3和表1对本步骤进行说明:假定得到19和20号节点,将1及其相似节点19、20合并起来称为“祖代集合”,同时对每个节点赋予一个分值,每个节点目前都是1分。

表1祖代集合

步骤S3,根据复杂系统中的节点之间的作用关系,对祖代集合中的每个祖代节点查找对应的子代节点,并根据子代节点的重合次数进行赋值,将子代节点构成子代集合。

在本步骤中,对“祖代集合”查询其实际连接节点。在对祖代节点查找子代节点的过程中,针对查找到的子代节点,每查找到一次则计1分,对同时属于多个祖代节点的子代节点,根据重复出现次数累积加分赋值。

参考图4和表2,由1得到12;由19得到2、4;由20得到5、4;将查询结果去重。并对每次碰到的重合节点都加1分,得到表2的结果,称为“子代集合”。

表2子代集合

步骤S4,根据复杂系统中的节点之间的作用关系,对子代集合中的每个子代节点查找对应的孙代节点,并根据孙代节点的重合次数进行赋值,将孙代节点构成孙代集合。

在本步骤中,在对子代节点查找孙代节点的过程中,针对查找到的孙代节点,每查找到一次则计1分,对同时属于多个子代节点的孙代节点,根据重复出现次数累积加分赋值。

参考图5和表3,对“子代集合”查询其实际连接节点。由2得到3、13;由4得到3、18、19、20;由5得到3、6、17、20;由12得到1、9、11、13、14;将查询结果去重,并对每次碰到的重合节点都加1分,得到表3的结果,称为“孙代集合”。

表3孙代集合

步骤S5,将得到的祖代集合、子代集合和孙代集合,将汇总后的结果进行去重,并对相同节点的得分进行累积相加,根据最终的节点和赋值得分,构成家族集合,如表4所示。

表4家族集合

步骤S6,对家族集合进行分析,对子代节点和孙代节点根据得分高低进行排序,根据排序结果选择得分大于1且排名为前N名的节点作为频率高出现的节点,判断这些节点与祖代节点之间存在隐含关系,且这些节点之间也存在隐含关系。

在本步骤中,按家族集合中节点得分顺序找到隐含关系点,把家族集合中的祖代集合节点去掉,如表5所示,然后按照得分进行排序,如表6所示。剩下的节点中得分高者就是给定节点的隐含关系节点。参考图6和表6,可见3号节点与1号节点存在隐含关系,4号节点和13号节点也与1号节点存在一定的隐含关系。

表5去除祖代

表6得分排序

这个结果的生物学原理是,如果尝试从给定祖先出发寻找后代,那么可以先找到该祖先的同辈兄弟,形成祖代集合,然后寻找祖代集合的后代,找到其中出现频率最高的后代,推测为给定祖先的后代。

步骤S7,获取家族集合的基因序列,其中,每个节点均包括一个或多个表示特征的基因单元,以及基因单元之间的连接关系。在本发明的实施例中,采用组成该节点名称的一个或多个词语,表示该节点的基因单元。

根据该节点的赋值得到对其所对应的每个基因单元进行加权得分,然后将所有节点中每组相同类型的基因单元进行相加合并,且保持已有连接关系不变,得到该家族集合的基因序列。具体来说,在本步骤中,求家族集合的基因序列。当祖代集合中的节点在复杂系统图上相互之间距离较远时,不一定能够得到重合频次高的后代。所以需要进一步提取出家族集合的基因序列,基于该基因序列在全系统中搜索基因匹配的节点,作为给定节点的隐含关系节点,可以完全不受相似节点之间相互距离远近的影响。

参考图7,1号节点基因单元序列可表示为A-B-C,2号节点基因单元序列可表示为B-D-A。其中A、B、C、D都是基因单元。

因1号节点得分等于2,因此形成一个序列,2A-2B-2C。

因2号节点得分等于1,因此形成一个序列,1B-1D-1A。

按照同类项相加合并,且保持已有连接的原则,形成一个基因图序列。

此外假定,20号节点可表示为D-E-C,

因20号节点得分等于3,因此形成一个序列,3D-3E-3C。对家族集合的每个节点进行上述计算,最终得到一个家族基因序列图,参考图3。

步骤S8,获取所有待比较节点的基因序列,将每个待比较节点的基因序列与家族集合的基因序列进行对比,计算该待比较节点与作为基准的家族集合的基因序列的相似度值,然后对所有待比较节点的相似度值进行排序,然后按照预设的筛选条件,从排序结果中筛选出最终的隐含关系节点。

在本步骤中,根据家族基因序列搜索隐含关系节点,以该家族基因序列图为基准,对比整个系统中每个节点的基因单元序列。

回顾家族基因序列图的由来,其生物学意义是,给定节点所在的第一代,第一代的下一代,和再下一代,一共三代的所有节点的混合特征。

假定一个待比较节点编号为99,其基因单元序列为D-A-H-C,这些待比较的节点,没有前述“得分”的概念。

本发明综合考虑基因单元的相似和单元之间的连接,计算出该点与基准的相似度数值,然后对所有节点的相似度数值进行排序,来列出给定点的隐含关系节点。

具体的,计算该待比较节点与作为基准的家族集合的基因序列的相似度值,包括如下步骤:

步骤S81:对待比较节点中的每个基因单元,在家族集合的基因序列中进行搜索,如果存在匹配,则将匹配基因单元在基因序列图中的赋值得分记录到变量s中,以此类推,对每个基因单元进行匹配计算,得到最终累计的变量s值。

具体的,取99号节点的第一个基因单元D,到基准图中搜索,如果存在匹配,则将基准图中该单元前缀数字,记录到一个变量s中。在这个例子中,s=4。如果没有搜索匹配,则s=0。

继续遍历99号节点的每一个单元,累加s。

D单元,s=4(该基因在整个家族的强度)

A单元,s=3

H单元,s=0

C单元,s=5

最终累计s=4+3+0+5=12。

步骤S82:获取待比较节点中基因单元之间的连接关系,在家族集合的基因序列中进行搜索,如果存在匹配的连接关系,则记录变量t值为1,以此类推,对每组连接关系进行匹配计算,得到最终累计的变量t值。

具体的,取99号节点的第一个基因单元D和第二个基因单元A,到基准图中搜索是否存在D-A的连接,在这个例子中存在,记录一个变量t=1,否则t=0。

继续遍历99号节点的每一个单元之间的连接,累加t,

D-A连接存在,t=1(基因关系)

A-H连接不存在,t=0

H-C连接不存在,t=0

最终累计t=1+0+0=1。

步骤3,取相似度变量m=s+t,这个例子中m=12+1=13。

以此类推计算出一个排序,根据应用的实际情况,根据百分比或绝对阈值取前几个作为最终的隐含节点。

在本发明的实施例中,预设的筛选条件包括:选择排序在前的预设比例范围内的节点或者变量m的值大于预设值的节点,作为隐含关系节点。

例如,设置排序在前30%的节点作为隐含关系节点,或者设置m的值大于预设15时,则判断该节点为隐含关系节点。

本发明可以应用于多种领域,下面举例说明:

(1)已知一位专家与多位专家之间的合作关系,以及其中部分专家与科技领域的关系,将上述信息构造为复杂关系图,可以推测某位专家跟哪些领域可能发生关系。

(2)已知某家企业与多家企业的合作关系,以及其中部分企业与某产业领域的关系,将上述信息构造为复杂关系图,可以推测某家企业跟哪些领域可能发生关系。

根据本发明实施例的推测复杂系统中节点之间隐含关系的方法,具有逻辑清晰、运算简单,没有浮点运算,对算力要求很低的特点。本发明可以非常广泛地应用在复杂系统图计算场景,在已知部分连接的前提下,非常快速便捷地推测隐含连接,为各类企业园区或政府、高校机构提供精准内容推荐的技术支持。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号