首页> 中国专利> 一种针对两类层次数据的对比关联可视分析方法和应用

一种针对两类层次数据的对比关联可视分析方法和应用

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公布了一种针对两类层次数据的对比关联可视分析方法(对比关联树)和应用，分别采用基于力导向的节点-链接树和基于放射环的空间填充树来表示两类层次数据，节点-链接树中节点表示为饼图，放射环的空间填充用颜色区分；并通过交互的方式展示两类数据的不同层次数据的对比和关联；该可视化方法可同时展示两种不同类层次数据中的层次关系和关联关系，并可对同一类层次数据的关联信息等数据进行直接对比，直观有效，且可避免出现视觉杂乱，能够帮助用户高效地查看数据间的关联关系，从而进行进一步的数据分析。

著录项

公开/公告号CN105224656A

专利类型发明专利
公开/公告日2016-01-06

原文格式PDF
申请/专利权人北京工商大学;
展开▼

申请/专利号CN201510640349.6
发明设计人陈谊;冯玉超;刘莹;杜晓敏;
展开▼

申请日2015-09-30
分类号G06F17/30(20060101);
代理机构北京万象新悦知识产权代理事务所(普通合伙);
代理人朱红涛
地址 100048 北京市海淀区阜成路33号
入库时间 2023-12-18 13:18:56

法律信息

法律状态公告日

法律状态信息

法律状态
2018-06-15

授权

授权
2016-02-03

实质审查的生效 IPC(主分类):G06F17/30 申请日:20150930

实质审查的生效
2016-01-06

公开

公开

说明书

技术领域

本发明属于信息可视化领域，具体涉及一种针对两类层次数据的对比关联可视分析方法 (对比关联树)和应用，通过交互的手段直接展示两类数据的不同层次数据的对比和关联。

背景技术

在现实工作和生活中，具有相互联系的多个层次结构广泛存在于食品安全、金融信息和社会网络等各领域中，对两个具有相同层次结构数据的进行对比分析同样是一个非常重要的课题。

2007年，YingTuandHan-WeiShen提出了一种能够展现树图的变化的可视化方法。该方法其实是两个树图在不同的时间点的对比。他们提出了一个树图布局算法，这个算法可以减少布局突变并能够产生一个持续的视觉模式。2008年，DannyHolten等人提出了一种新的可视化层次结构数据的方法，该方法主要是用于对比不同版本的软件系统的内部结构的变化。 2011年K.Dinkla等人提出了一种比较多个具有权重的层次结构的可视化方法，该可视化方法采用节点-链接树，用热力图来显示节点链接树中的节点的各个子节点的权重；该方法同时提供了交互手段，可以隐藏暂时不需要的节点，细览需要查看的节点。2011年SebastianBremm 等人提出了一种基于交互的对多个树进行比较的可视分析方法，该方法通过交互显示和隐藏节点，以达到不但能查看全局概览还能查看局部细节的目的。2012年，JohnAlexisGuerra-G ómez等人提出了一系列交互式的可视化方法，他们利用多视图与交互的方式分别展现两个年份的预算以及两个年份预算的对比，用颜色以及颜色的深浅来表示两个年份预算变化的程度。

综合说来，针对单一类层次数据的可视化方法，主要包括节点-链接法(Node-Link)和空间填充法(Space-Filling)两大类。

节点-链接法是外观上最接近树型结构的层次数据可视化方法，该方法采用节点表示树型结构中的信息单元，用连线表示树型结构中的父子关系，可以直观的展示层次结构。常见的方法有树(Tree)，双曲树(HyperbolicBrowser)及径向树(RadialTree)等。空间填充法的主要思想是将整个信息集合映射到一个区域，通过矩形，正方形，扇形或多边形等形状进行嵌套填充以描述层次结构。其中，常见的方法有两种：树图(Treemap)和放射环(Sunburst)。

此外，混合(Hybrid)布局算法在层次数据可视化方法中也逐渐发展起来，其主要思想是将节点-链接，空间填充以及简单的统计图有效的结合起来。Zhao等人在2005年提出将节点- 链接和树图相结合，允许用户高效查看各节点的信息属性，保留了节点-链接对层次结构及树图对节点权值的高表现性。

现实世界存在着许多不仅包含层次关系，还包含关联关系的复杂数据，针对这类数据集，利用现有的放射环算法对其进行可视化还难以达到较好的效果。

对于既有关联关系又有层次关系的数据集，DannyHolten等人于2006年提出了一个名为层次边绑定(HierarchicalEdgeBundles)的可视化方法，该层次绑定的方法减少了视觉杂乱。在2005年之前，如何在一个项集格(itemsetlattice)中展现多个频繁项集是可视化频繁项集和关联规则的一个基础性问题。另一个问题来自缺少呈现多对多关系的视觉隐喻。Petra Neumann等人2005年采用Arctrees展现层次数据中两个树之间的关联关系，但是，这种基于树图的方法体现了树图的缺点，它并不能直观地并清晰地展示树的层次关系，而这恰恰是所重视的。GouL等人2011年采用TreeNetViz布局展现在一个树中不同层次的节点之间的关系，它试图展现的是属于同一个父节点的兄弟节点之间的关联关系，但无法展现不属于同一个父节点之间的关联关系。2014年，YiChen等人提出了一种基于聚类排序的放射环算法 (SONHC)。这个方法的优点是充分利用了放射环根节点的显示空间，缺点是当放射环根节点内部的节点具有层次结构或者数量过多时，会出现视觉杂乱。

发明内容

为了克服上述现有技术的不足，本发明提供一种针对两类层次数据的对比关联可视分析方法，称之为对比关联树，分别采用基于力导向的节点-链接树和基于放射环的空间填充树来表示两类层次数据，并通过交互的方式展示两类数据的不同层次数据的对比和关联；该可视化方法可直观有效展示具有相关联关系的两类层次数据，且可避免出现视觉杂乱。

本发明的基本思想是：针对有相关联关系的两类层次数据，首先用基于力导向的节点- 链接树表示第一类层次数据，用节点-链接关系来代表该类层次数据内部的层次关系(如：蔬菜与蔬菜子类间的层次关系)，并将节点-链接树的每个节点当作一个饼图，饼图可包括多个扇形部分，此多个部分隶属于同一类，具有相同的层次结构，因此可根据需求对多个扇形部分所代表的数据差异进行针对性的对比显示(例如：针对同一农产品类别可比较北京市地区和天津市地区两处相应的农药种类检出数量差异，此时一个饼图则包括两个扇形部分)；同时，用节点扇形是否有边来表示某特殊属性信息(如：是否检出超标农药)。其次，用基于放射环的空间填充树来表示与第一类层次数据相关联的第二类层次数据信息；然后，采用交互的方式而非直线连接各节点的方法来针对地选择特定节点扇形的关联层次数据信息(例如，农产品类别与农药类别之间的检出关系)来进一步展示更具体的信息。

本发明待处理的有相关联关系的两类层次数据，指的是一组通过层次结构关系互相关联的数据。例如，食品中农药残留检测数据包含农产品、农药和地域等两类以上的层次数据。农产品具有明显的层次结构，如：蔬菜大类包括叶菜类蔬菜、芸薹属类蔬菜等类别，叶菜类蔬菜下属也有大白菜、小白菜等蔬菜小类。而农药层次按照毒性程度也可以分为4个类别：低毒、中毒、高毒和剧毒；每种毒性又包含有多种农药，也具有层次结构。可见，农产品和农药这两类关联层次数据是具有关联关系的两种不同类的层次数据。同样，地域层次数据也会有不同的分类，也会具有其特有的层次结构。农产品的农药检出关系就是农产品信息与农药信息之间的关联关系。一般地，在农药残留检测数据中，不同检测地区的农产品农药检出状况不同，在同一地区不同时间的农药检出状况也不同。

本发明提供的技术方案是：

一种针对两类层次数据的对比关联可视分析方法，称之为对比关联树，分别采用基于力导向的节点-链接树和基于放射环的空间填充树来表示两类层次数据，并通过交互的方式展示两类数据的不同层次数据的对比和关联，包括如下步骤：

步骤一、用多叉树A和B分别存储待可视化的两类层次数据I和II；其中，第一类层次数据集I包括两个或两个以上的层次数据集；多叉树A包括多个多叉树，分别存储第一类层次数据集I中的多个层次数据集；

多叉树A可包括多个多叉树；当第一类层次数据集I中包括两个层次数据集时，多叉树 A包括多叉树A1和多叉树A2；当第一类层次数据集I中包括两个以上层次数据集时，多叉树A包括相对应数目的多叉树，分别存储第一类层次数据集I中包括的多个层次数据集。

步骤二、对步骤一中得到的第一类层次数据I进行可视化，执行如下操作：

2a)针对多叉树A，采用力导向(force-direct)算法生成节点-链接布局(layoutofnode-link)；每一个节点代表多叉树A所包括的多个多叉树相对应的同层次数据；

本发明实施例中，多叉树A包括多叉树A1和多叉树A2；针对多叉树A1与A2，采用力导向(force-direct)算法生成节点-链接布局(layoutofnode-link)，A1和A2属同一类层次数据I，因此A1和A2共用一个节点来表示，分别为该节点的两个部分；

2b)将每个节点均用饼图表示；饼图包括多个扇形分区，扇形分区的数目与多叉树A所包括的多叉树的数目相同；

本发明实施例中，多叉树A包括两个多叉树A1和A2；相应地，将饼图划为两个分区 A1和A2，饼图上各自占比分别代表A1与A2所代表属性值的权重的占比；

2c)用颜色来区分饼图包括的多个扇形分区；

比如，绿色的部分代表A1的权重，红的部分代表A2的权重，全绿代表A1的权重为100％，全红代表A1的权重为0％。

2d)代表每个节点的饼图可通过扇形部分是否有弧边来表示某种特殊属性信息；

例如，在本发明实施例中，通过扇形部分是否有弧边来表示所检出的农药是否超标，即：如果在北京市某蔬菜中检出了超标的农药，则在节点扇形的相应部分用弧边来表示；相应地，没有弧边的扇形部分则表示在该类蔬菜中未在此部分所代表的地区检出超标农药。

步骤三、对第二类层次数据II进行可视化处理和布局：

采用放射环(sunburst)算法生成多叉树B的空间填充布局(layoutofspace-filling)，通过颜色来标注多叉树B相对应数据的层次特征；在本发明实施例中，多叉树B表示的是农药类数据，则通过放射环颜色来表示农药的毒性特征如中毒、剧毒等。

步骤四、采用交互方式而非直线连接各节点显示关联数据的方法实现对两类层次数据I 和II中的关联关系的可视化，从而减少视觉混乱度。具体为：

4a)首先，使步骤二中节点-链接布局中的根节点位于步骤三中空间填充布局的根节点显示区域的中心点(可用符号O表示)位置处，确保节点-链接布局位于空间填充布局中的根节点显示区域内；

4b)根据两类层次数据之间的关联关系信息，多叉树A和多叉树B中有关联关系的节点称为关系节点，通过交互的方式找到多叉树A所对应的多叉树B中有关联关系的节点(即通过点击多叉树A的节点找到与A类数据相关的所有B类数据所对应的多叉树B的节点)，并在上述步骤已得到的视图上(包括：用饼图作为节点的节点链接树A以及空间填充布局之后的B类数据对应的放射环)，将有关联关系的B的节点直接由放射环表示；从而实现点击节点-链接布局中某一节点中饼图的某一扇形部分，就可以得到只与这部分相关联的另一类层次数据II；

4c)分别点击节点-链接树的各节点的每个扇形部分，即可得到每个扇形部分所关联的另一类层次数据之间的差异，通过交互方式进行对比查看。

本发明同时提供一种应用，把上述针对两类层次数据的对比关联可视分析方法应用于农药残留数据的展示分析，具体是，把两类层次数据(农产品类和农药类)进行相应的对比关联分析，并将农产品类层次数据分为两部分(对应不同地区)，有针对性地对数据的地区差异进行对比分析；将农产品类层次数据用多叉树A表示，采用力导向(force-direct)算法生成节点 -链接布局(layoutofnode-link)，每个节点均用饼图表示；将饼图划为两个分区A1和A2，饼图中各自占比分别代表A1与A2所代表属性值的权重的占比，用颜色来区分；将农药类层次数据用多叉树B表示，采用放射环(sunburst)算法生成B的空间填充布局(layoutof space-filling)，通过颜色来标注农药类层次数据B的毒性层次数据特征；再用交互方式而非直线连接各节点显示关联数据的方法实现对两类层次数据的关联关系的可视化，以达到区分表示具有关联性的两类层次数据集而又能减少视觉混乱度的目的。

与现有技术相比，本发明的有益效果是：

本发明提出一种针对两类层次数据的对比关联可视分析方法(对比关联树)，分别采用基于力导向的节点-链接树和基于放射环的空间填充树来表示两类层次数据，并通过交互的方式展示两类数据的不同层次数据的对比和关联；该可视化方法可直观有效展示具有相关联关系的两类层次数据，且可避免出现视觉杂乱。

本发明通过交互的手段直接展示两类数据的不同层次数据的对比和关联，可同时展示两种不同类层次数据中的层次关系和关联关系，并可对同一类层次数据的关联信息等数据进行直接对比，帮助用户高效地查看数据间的关联关系，从而进行进一步的数据分析。

附图说明

图1为本发明提供的针对两类层次数据的对比关联可视分析方法的流程框图。

图2为本发明实施例中对多叉树A表示的第一类层次数据采用力导向算法生成的节点- 链接布局的示意图。

图3为本发明实施例中对多叉树B表示的第二类层次数据采用放射环算法生成的空间填充布局的示意图。

图4为本发明实施例中对天津市和北京市冬瓜中的农药残留检测数据通过对比关联可视分析方法进行可视化得到的显示结果图；

其中，1为天津市冬瓜所占权重的比例；2为北京市冬瓜所占权重的比例。

具体实施方式

下面结合附图，通过实施例进一步描述本发明，但不以任何方式限制本发明的范围。

利用本发明提供的针对两类层次数据的对比关联可视分析方法，实施例通过对比不同地区的农产品中的农药检出情况来分析它们之间的相同与不同之处，并通过对比同一个地区不同时间段的农产品中的农药检出情况来分析此地区农药施用的变化。

实施例以两类(例如：农产品类和农药类)层次数据为例进行相应的对比关联分析，并将某一类层次数据分为两部分以进行针对性地数据差异对比(如：对比北京市和天津市的农药检出情况)。图1为本发明提供的针对两类层次数据的对比关联可视分析方法的流程框图。其具体操作步骤为：

步骤一、用三个多叉树分别存储待可视化的两类层次数据I和II；

三个多叉树分别记为多叉树A1、A2和多叉树B，其中多叉树A1、A2用于存储同一类层次数据I，具有相同的层次结构，多叉树B用于存储另一类层次数据II。其中，所述多叉树中的节点采用顺序存储结构与链式存储结构相结合的方法，具体为：采用链式存储结构按照自顶向下的顺序存储每一层次中的第一个节点；对于同一层次中的节点采用顺序存储结构。

本实施例中，多叉树A为某蔬菜类别树，多叉树B代表农药类别树；则多叉树A1、A2 分别表示北京和天津各自的蔬菜类别树。

步骤二、对步骤一中得到的第一类层次数据I进行可视化；图2为本发明实施例中对多叉树A表示的第一类层次数据采用力导向算法生成的节点-链接布局的示意图。

2a)针对多叉树A1与A2，采用力导向(force-direct)算法生成节点-链接布局(layoutof node-link)，A1和A2属同一类层次数据I，因此A1和A2共用一个节点来表示，分别为该节点的两个部分；

2b)将每个节点均用饼图表示。相应地，将饼图划为两个分区A1和A2，饼图上各自占比分别代表A1与A2所代表属性值的权重的占比；

2c)用颜色来区分A1与A2，比如绿色的部分代表A1的权重，红的部分代表A2的权重，全绿代表A1的权重为100％，全红代表A1的权重为0％。

2d)采用每个节点扇形部分是否有边来表示某种特殊属性信息。

步骤三、对第二类层次数据II进行可视化处理和布局；

采用放射环(sunburst)算法生成B的空间填充布局(layoutofspace-filling)，通过颜色来标注B的层次数据特征(如农药类数据特征：中毒、剧毒等)；图3为本发明实施例中对多叉树B表示的第二类层次数据采用放射环算法生成的空间填充布局的示意图。

步骤四、采用交互方式而非直线连接各节点显示关联数据的方法实现对两类层次数据I 和II中的关联关系的可视化，从而减少视觉混乱度。具体为：

4b)根据两类层次数据之间的关联关系信息，通过交互的方式找到多叉树A1或A2所对应的多叉树B中有关联关系的节点(即通过点击多叉树A的节点找到与A类数据相关的所有 B类数据所对应的多叉树B的节点)，并在上述步骤已得到的视图上(包括：用饼图作为节点的节点链接树A1/A2以及空间填充布局之后的B类数据对应的放射环)，将有关联关系的B 的节点直接由放射环表示；从而实现点击节点-链接布局中某一节点中饼图的一部分A1，就可以得到只与这部分相关联的另一类层次数据II；多叉树A和多叉树B中有关联关系的节点称为关系节点；

4c)分别点击节点-链接树的各节点的两部分即可对比查看两部分扇形所关联的另一类层次数据之间的差异。

经过上述步骤的操作，得到最终可视化结果。

本实施例中的数据来源为天津市和北京市农产品中的农药残留检测结果，两类层次数据分别是农药毒性层次数据和农产品层次数据(农产品层次数据包括两种，分别为天津市和北京市的农产品层次数据)，分别如表1、表2和表3所示。两类层次数据之间的关联关系信息如表4所示。

表1农药毒性层次数据(农药毒性分类信息表)

表2天津市蔬菜关系层次数据(天津市蔬菜信息表)

表3北京市蔬菜关系层次数据(北京市蔬菜信息表)

表4农产品信息与农药信息关联关系表(以天津市的冬瓜为例)

针对以上数据，两类层次数据是指农产品类和农药类两类，可分别用不同的层次可视化方法展示，并通过建立关联进行查看这两类数据的关系。北京市和天津市的农产品属同一类，在可视化表示时采用同一个农产品节点，该农产品节点包括两个部分。农药类数据的层次关系为低毒、中毒、高毒和剧毒；农产品的层次关系体现为蔬菜->叶类蔬菜->菠菜等；例如，北京的菠菜和天津的菠菜是同一类层次数据(均为农产品中的菠菜)，北京的菠菜所检出农药种类数目和天津相应的会有所不同，因此，可作为同一个节点饼图里的两部分，交互时可以动态显示。

采用本发明提出的两类关联层次数据的可视化方法，对上述数据进行可视化操作，其具体操作步骤为：

步骤一、；用多叉树A1、A2分别存储天津市与北京市的蔬菜关系的层次数据；用多叉树 B存储代表农药毒性的层次数据。多叉树A1、A2和多叉树B中的节点采用顺序存储结构与链式存储结构相结合的方法，具体为：采用链式存储结构按照自顶向下的顺序存储每一层次中的第一个节点；对于同一层次中的节点采用顺序存储结构。

步骤二、执行如下操作：

对步骤一中得到的多叉树A1与A2采用力导向(force-direct)算法生成节点-链接布局 (layoutofnode-link)，A1和A2属同一类层次数据(蔬菜)，因此A1和A2共用一个节点来表示，分别为该节点的两个部分。

将每个节点用一个饼图表示，饼图只有两个分区，分别代表A1与A2所代表属性的权重的占比。A1代表天津市中蔬菜的层次数据，如表2所示，A2代表北京市中蔬菜的层次数据如表3所示。

用颜色来区分A1与A2，红色(或深灰色)代表天津市中的蔬菜数据(A1)，绿色(或浅灰色)代表北京市的蔬菜数据(A2)，A1与A2所占的面积的大小分别代表在天津市和北京市中此种蔬菜中所检出的农药种类数占比，通过饼图两部分对比可以很清晰地看出两个地区所检出农药的种类数的情况，如图2所示。

另外，根据每个节点扇形部分是否有边来表示某种特殊属性信息(如所检出的农药是否超标)。也即：如果在北京市某蔬菜中检出了超标的农药，则在节点扇形的相应部分用边来表示。相应地，没有边的扇形部分则表示在该类蔬菜中未在此部分所代表的地区(如：北京市或天津市)检出超标农药。

步骤三、对第二类层次数据II(农药数据)进行可视化处理和布局。采用放射环(sunburst) 算法生成B(农药层次数据)的空间填充布局(layoutofspace-filling)，通过颜色来标注其层次数据特征(如农药类数据特征：中毒、剧毒等)。

步骤四、采用交互方式而非直线连接各节点显示关联数据的方法实现对两类层次数据I (蔬菜类农产品层次数据)和II(农药层次数据)中的关联关系的可视化，从而减少视觉混乱度。具体为：

首先，使步骤二中节点-链接布局中的根节点位于步骤三中空间填充布局的根节点显示区域的中心点(用符号O表示)位置处，确保节点-链接布局位于空间填充布局中的根节点显示区域内；

根据两类层次数据之间的关联关系信息，通过交互的方式找到多叉树A1(代表天津市蔬菜)或A2(代表北京市蔬菜)所对应的多叉树B中有关联关系的节点(检出的农药)，并在上述步骤已得到的视图上将有关联关系的B的节点(农药)直接由放射环表示，实现当点击节点-链接布局中某一节点中饼图的一部分A1，就可以得到只与这部分相关联的另一类层次数据；其中，多叉树A和多叉树B中有关联关系的节点称为关系节点；

分别点击节点-链接树的各节点的两部分即可对比查看两部分扇形所关联的另一类层次数据之间的差异。

图4为本发明实施例中对天津市和北京市冬瓜中的农药残留检测数据通过对比关联可视分析方法进行可视化得到的显示结果图。经过上述步骤的操作，得到最终可视化结果，如图 4所示，被点击选定的节点饼图的那一部分颜色会相对加深，并且该部分附近有文本框提示；例如，图4中左上角有一个节点分为两部分1和2，数字1代表天津市冬瓜，2代表北京市冬瓜，1部分被点击后红色(或深灰色)略有加深，附近有文本框提示‘天津市冬瓜’。

通过以上方法，可以查看某种蔬菜在某地区中所检出的所有农药，而这些农药又被划分为四个部分来显示：剧毒农药、高毒农药、中毒农药、低毒农药，因此还可以看出所检出的各种毒性农药在某种农产品中的分布状况。

需要注意的是，公布实施例的目的在于帮助进一步理解本发明，但是本领域的技术人员可以理解：在不脱离本发明及所附权利要求的精神和范围内，各种替换和修改都是可能的。因此，本发明不应局限于实施例所公开的内容，本发明要求保护的范围以权利要求书界定的范围为准。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种针对两类层次数据的对比关联可视分析方法和应用 [P] . 中国专利： CN105224656B . 2018.06.15
2. 一种针对两类层次数据的对比关联可视分析方法和应用 [P] . 中国专利： CN105224656A . 2016-01-06
3. Method of analyzing organizing and visualizing chemical data with feature hierarchy [P] . 美国专利： US6323852B1 . 2001-11-27

机译：具有特征层次的化学数据组织可视化分析方法
4. method for visually presenting data associated with a process facility, and system for visually presenting signal processing data associated with a process facility [P] . BRPI0508358A . 2007-07-24

机译：可视地呈现与处理设施相关联的数据的方法以及用于可视化呈现与处理设施相关联的信号处理数据的系统
5. METHODS AND SYSTEMS FOR SIMULTANEOUS ALLELIC CONTRAST AND COPY NUMBER ASSOCIATION IN GENOME-WIDE ASSOCIATION STUDIES [P] . 美国专利： US2011093209A1 . 2011-04-21

机译：全基因组关联研究中同时进行别针对比度和拷贝数关联的方法和系统