公开/公告号CN106874349A
专利类型发明专利
公开/公告日2017-06-20
原文格式PDF
申请/专利权人 深圳市位和科技有限责任公司;
申请/专利号CN201611223204.7
申请日2016-12-26
分类号G06F17/30(20060101);G06K9/62(20060101);
代理机构44287 深圳市世纪恒程知识产权代理事务所;
代理人胡海国
地址 518000 广东省深圳市龙华新区观澜街道观光1301号银星科技大厦第7层
入库时间 2023-06-19 02:35:50
法律状态公告日
法律状态信息
法律状态
2018-04-10
授权
授权
2017-07-14
实质审查的生效 IPC(主分类):G06F17/30 申请日:20161226
实质审查的生效
2017-06-20
公开
公开
技术领域
本发明涉及数据探索和分析技术领域,尤其涉及一种基于交互可视化的多维数据分析方法及系统。
背景技术
数据分析是一个探索的过程,分析人员通过地图、图形、数据统计以及计算机算法处理、分析数据,进而进行动态交互,寻找模式,验证假设,进而发现未知信息。
目前,在多维数据的探索和分析领域一般采用传统的GIS(Geographic Information System/Geo-Information system,地理信息系统)分析方法,这种分析方法存在一定的局限性。
例如,传统GIS方法的通常做法是对单变量分类生成专题图,然后加权叠加若干专题图来实现多变量分类。主要存在以下局限:它假设多变量之间的关系是线性的,它生成的分类结果对于用户来说,无法清楚地表明每一类代表什么,难以体现出类与类之间的差别,并且在多维数据探索分析上不能够实现动态有效的多维属性的交互联动和分析。并且,传统GIS方法无法有效展现多维属性特征在空间上的分布模式及各属性维度之间的关联关系。
发明内容
本发明提供一种基于交互可视化的多维数据分析方法及系统,其主要目的在于解决现有的多维数据探索分析上不能够实现动态有效的多维属性的交互联动和分析,以及无法有效展现多维属性特征在空间上的分布模式及各属性维度之间的关联关系的技术问题。
为实现上述目的,本发明提供一种基于交互可视化的多维数据分析方法,该基于交互可视化的多维数据分析方法包括:
获取待分析数据,确定所述待分析数据需要展示的属性维度,按照确定的所述属性维度对所述待分析数据进行聚类分析;
根据聚类分析的结果为每一个聚类赋予不同的颜色,聚类之间的差别越小,聚类对应的颜色差别越小,聚类之间的差别越大,聚类对应的颜色差别也越大;
按照确定的所述属性维度,以及各个聚类赋予的颜色,展示所述待分析数据的集成地图及与所述集成地图关联的平行坐标图;
接收基于所述平行坐标图触发的第一交互操作,按照所述第一交互操作更新展示的所述平行坐标图和所述集成地图。
可选地,所述展示所述待分析数据的平行坐标图的步骤包括:
确定当前选择的展示模式,所述展示模式包括聚类模式和数据模式;
若当前选择的展示模式为聚类模式,则获取所述待分析数据中所述各个属性维度的各个聚类数据平均值,基于获取到的所述聚类数据平均值展示所述平行坐标图,所述平行坐标图中的每条折线代表一个聚类;
若当前选择的展示模式为数据模式,则基于所述待分析数据中所述各个属性维度的完整数据记录,展示所述平行坐标图,所述平行坐标图中的每条折线代表一条数据记录。
可选地,所述接收基于所述平行坐标图触发的第一交互操作,按照所述第一交互操作更新展示的所述平行坐标图的步骤包括:
接收基于所述平行坐标图触发的第一交互操作,确定所述第一交互操作选择的聚类;
在所述平行坐标图中,按照赋予的颜色和选择的所述聚类展示各个属性维度数据,按照灰度模式展示未选择的聚类的各个属性维度数据;
在所述集成地图中,按照赋予的颜色,展示选择的聚类对应的地理区间,按照灰度模式展示未选择的聚类对应的地理区间。
可选地,所述获取待分析数据,确定所述待分析数据需要展示的属性维度,按照确定的所述属性维度对所述待分析数据进行聚类分析的步骤包括:
获取待分析数据,基于接收到的配置请求展示属性配置界面;
接收用户基于所述属性配置界面设置的分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重;
按照设置的分类个数、需要展示的属性维度以及设置的所述权重对所述待分析数据进行聚类分析。
可选地,若需要展示的所述属性维度中包含有时间维度,则展示所述待分析数据的集成地图及与所述集成地图关联的平行坐标图的同时,所述基于交互可视化的多维数据分析方法还包括:
基于所述聚类分析的结果、为各个聚类赋予的颜色,以及时间维度的参数,展示所述待分析数据的时间矩阵图和地图矩阵,其中,所述时间矩阵图的横轴和纵轴分别为时间参数和地理区间参数,所述地图矩阵包括时间维度的各个时间对应的地图;
接收基于所述时间矩阵图或者地图矩阵触发的第二交互操作,并根据接收到的所述第二交互操作,更新展示所述集成地图、所述平行坐标图、所述时间矩阵图和/或所述地图矩阵。
此外,为实现上述目的,本发明还提供一种基于交互可视化的多维数据分析系统,该基于交互可视化的多维数据分析系统包括:
确定模块,用于获取待分析数据,确定所述待分析数据需要展示的属性维度;
分析模块,用于按照确定的所述属性维度对所述待分析数据进行聚类分析;
赋色模块,用于根据聚类分析的结果为每一个聚类赋予不同的颜色,聚类之间的差别越小,聚类对应的颜色差别越小,聚类之间的差别越大,聚类对应的颜色差别也越大;
展示模块,用于按照确定的所述属性维度,以及各个聚类赋予的颜色,展示所述待分析数据的集成地图及与所述集成地图关联的平行坐标图;
互动模块,用于接收基于所述平行坐标图触发的第一交互操作,按照所述第一交互操作更新展示的所述平行坐标图和所述集成地图。
可选地,所述展示模块包括:
确定单元,用于确定当前选择的展示模式,所述展示模式包括聚类模式和数据模式;
第一展示单元,用于若当前选择的展示模式为聚类模式,则获取所述待分析数据中所述各个属性维度的各个聚类数据平均值,基于获取到的所述聚类数据平均值展示所述平行坐标图,所述平行坐标图中的每条折线代表一个聚类;
第二展示单元,用于若当前选择的展示模式为数据模式,则基于所述待分析数据中所述各个属性维度的完整数据记录,展示所述平行坐标图,所述平行坐标图中的每条折线代表一条数据记录。
可选地,所述互动模块还用于:接收基于所述平行坐标图触发的第一交互操作,确定所述第一交互操作选择的聚类;
所述展示模块还用于:在所述平行坐标图中,按照赋予的颜色和选择的所述聚类展示各个属性维度数据,按照灰度模式展示未选择的聚类的各个属性维度数据;以及在所述集成地图中,按照赋予的颜色,展示选择的聚类对应的地理区间,按照灰度模式展示未选择的聚类对应的地理区间。
可选地,所述展示模块还用于:获取待分析数据,基于接收到的配置请求展示属性配置界面;
所述基于交互可视化的多维数据分析系统还包括:
配置模块,用于接收用户基于所述属性配置界面设置的分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重;
所述分析模块还用于:按照设置的分类个数、需要展示的属性维度以及设置的所述权重对所述待分析数据进行聚类分析。
可选地,若需要展示的所述属性维度中包含有时间维度,则所述展示模块还用于:基于所述聚类分析的结果、为各个聚类赋予的颜色,以及时间维度的参数,展示所述待分析数据的时间矩阵图和地图矩阵,其中,所述时间矩阵图的横轴和纵轴分别为时间参数和地理区间参数,所述地图矩阵包括时间维度的各个时间对应的地图;
所述互动模块还用于:接收基于所述时间矩阵图或者地图矩阵触发的第二交互操作,并根据接收到的所述第二交互操作,更新展示所述集成地图、所述平行坐标图、所述时间矩阵图和/或所述地图矩阵。
本发明提出的基于交互可视化的多维数据分析方法及系统,在进行多维数据的分析展示时,按照确定的需要展示的属性维度,并基于上述确定的属性维度对待分析数据进行聚类分析,并且为每一个聚类赋予不同的颜色,按照确定的所述属性维度,以及各个聚类赋予的颜色,展示待分析数据的集成地图和平行坐标图,并且系统可以接收用户基于平行坐标图触发的第一交互操作,按照第一交互操作更新展示平行坐标图和集成地图,也就是说,本发明的方案对于待分析数据中的确定的多个变量(即属性维度)进行分类生成不同类型的专题图并展示,包括平行坐标图和集成地图,这种分类结果对于用户来说,能够从图上清楚地看出每个聚类代表什么,能够体现出类与类之间的差别,此外,用户可以根据需要对上述专题图进行动态的交互操作,系统会根据用户的交互操作对应地更新展示的专题图,实现动态有效的多维属性的交互联动和分析,并且能够有效地表达多维属性特征在空间上的分布模式及各属性维度之间的关联关系。
附图说明
图1为本发明基于交互可视化的多维数据分析方法第一实施例的流程图;
图2为本发明基于交互可视化的多维数据分析方法第一实施例中集成地图的示意图;
图3为本发明基于交互可视化的多维数据分析方法第一实施例中聚类模式下平行坐标图的示意图;
图4为本发明基于交互可视化的多维数据分析方法第一实施例中数据模式下平行坐标图的示意图;
图5为本发明基于交互可视化的多维数据分析方法第一实施例中基于平行坐标图的交互示意图;
图6为本发明基于交互可视化的多维数据分析方法第一实施例中基于平行坐标图进行第一交互操作后的集成地图的示意图;
图7为本发明基于交互可视化的多维数据分析方法第三实施例中二维颜色矩阵的示意图;
图8为本发明基于交互可视化的多维数据分析方法第二实施例中步骤S10的细化流程示意图;
图9为本发明基于交互可视化的多维数据分析方法第三实施例中的时间矩阵示意图;
图10为本发明基于交互可视化的多维数据分析方法第三实施例中地图矩阵示意图;
图11为本发明基于交互可视化的多维数据分析系统第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于交互可视化的多维数据分析方法。参照图1所示,为本发明基于交互可视化的多维数据分析方法第一实施例的流程图。
在本实施例中,该基于交互可视化的多维数据分析方法包括:
步骤S10,获取待分析数据,确定所述待分析数据需要展示的属性维度,按照确定的所述属性维度对所述待分析数据进行聚类分析;
本实施例提出的基于交互可视化的多维数据分析方法基于智能终端实现,例如,手机、平板电脑、PC(personal computer,个人电脑)等智能终端。该方法包括对多维属性空间数据的分析以及多维属性特征间的关联分析。提供一多维数据的分析系统,用户将待分析的数据上传至该系统,其中,待分析数据中包括统计的各个属性维度下的数据,待分析数据中的每一条数据记录都对应地理区间上的一个空间单元。系统获取到待分析数据后,确定待分析数据需要展示的属性维度,其中,用户可以根据自己的需要选择要展示的维度,例如,数据中包含的属性维度一共有十个,而用户只想对其中三个属性维度的数据进行展示分析,则可以在分析系统的设置中选择要展示的三个属性维度。
系统根据确定的属性维度对待分析数据进行聚类分析,聚类分析是将相似的数据将对象的集合分组为由类似的对象组成的多个类的分析过程,系统衡量数据之间的相似性,将相似的数据分到一个类别中。此外,聚类分析是一种探索性的分析,在分类的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。在该实施例中,系统对待分析数据进行聚类分析得到多个聚类,将相似的数据分到同一类别中,每一个聚类中的数据具有一定的相似性。其中,得到的聚类的个数可以由用户根据需要设置,或者按照系统默认分类个数进行聚类分析。
步骤S20,根据聚类分析的结果为每一个聚类赋予不同的颜色,聚类之间的差别越小,聚类对应的颜色差别越小,聚类之间的差别越大,聚类对应的颜色差别也越大;
步骤S30,按照确定的所述属性维度,以及各个聚类赋予的颜色,展示所述待分析数据的集成地图及与所述集成地图关联的平行坐标图;
预先设置赋色规则,根据聚类分析的结果为每一个聚类赋予不同的颜色。每一个聚类据聚类分析结果中其他聚类的颜色均是不相同的。参照图2和图3所示,图2为集成地图,图3为平行坐标图。这些图表中,对于同一聚类展示相同的颜色。如图3所示,以对某个地区选举情况的投票数据统计,共有三个属性维度:BUSH_PCT、KERRY_PCT及NADER_PCT。平行坐标图上每一条纵坐标代表一个属性维度。其中,在根据聚类分析的结果为每一个聚类赋予颜色时,根据聚类结果确定类与类之间的区别,根据类与类之间的差别为每个聚类赋予颜色,相似的类颜色差别小,差别大的类颜色差别也大。本实施例的方法通过这种色彩展示方式,体现出分类的差异,辅助用户更好的分析数据。
而且,平行坐标轴体现出了对多维属性维度之间的关联关系,集成地图展示了多维属性特征在空间上的分布模式。平行坐标轴上的每个轴代表一维属性(即一个属性维度),有几维属性就有几个坐标轴。聚类之后,每个聚类在平行坐标轴上都用一条线来展示,这条线在每个轴上都有一个结点,标记了这个聚类在每个属性维度上的值。聚类之间的关联关系通过代表每个聚类的线段之间的关系来表达,若两个聚类在两个坐标轴之间的线段平行,则这两个坐标轴代表的两个属性维度之间是正相关关系;若两个聚类在两个坐标轴之间的线段呈现交叉,则这两个坐标轴代表的两个属性维度之间是负相关关系。
具体地,关于展示模式,本实施例中的展示模式至少包括以下两种:聚类模式和数据模式。
若当前选择的展示模式为聚类模式,则获取所述待分析数据中所述各个属性维度的各个聚类数据平均值,基于获取到的所述聚类数据平均值展示所述平行坐标图,所述平行坐标图中的每条折线代表一个聚类;
若当前选择的展示模式为数据模式,则基于所述待分析数据中所述各个属性维度的完整数据记录,展示所述平行坐标图,所述平行坐标图中的每条折线代表一条数据记录。
参照图3所示,平行坐标图即为聚类模式,每条折线只代表一个聚类,而非一条数据记录,而对于数据模式下,每一条折线代表着一条数据记录。此外,对于平行坐标图中的坐标展示方式可以有多种。参照图4所示,平行坐标图即为数据模式。进一步地,可以将聚类分析的结果基于选择的属性图维度展示对应的分类柱状图。
步骤S40,接收基于所述平行坐标图触发的第一交互操作,按照所述第一交互操作更新展示的所述平行坐标图和所述集成地图。
具体地,参照图5所示,用户可以基于平行坐标图触发第一交互操作,分析系统接收基于所述平行坐标图触发的第一交互操作,确定所述第一交互操作选择的聚类,如图5中的BUSH_PCT与KERRY_PCT轴之间的纵向黑色线条,即为第一交互操作的轨迹;在所述平行坐标图中,按照赋予的颜色和选择的所述聚类展示各个属性维度数据,按照灰度模式展示未选择的聚类的各个属性维度数据;参照图6所示,同时,对应地在所述集成地图中,按照赋予的颜色,展示选择的聚类对应的地理区间,按照灰度模式展示未选择的聚类对应的地理区间。
此外,在其他的实施例中,关于基于平行坐标图触发的第一交互操作,还可以是对于坐标平行图上的纵坐标轴的拖拽操作,用户可以直接将鼠标放置在想要更换位置的纵坐标轴上,将其拖动到想要放置的位置,松开鼠标即可,这样可以用户可以根据需要调整坐标轴的排列顺序,以便于用户观察多个属性维度之间的关联关系,实现动态有效的多维属性的交互联动和分析。可以理解的是,上述第一交互操作也可以是触摸操作。也可以基于集成地图触发交互操作,对地图进行缩放、选择等操作。
进一步地,作为一种实施方式,该方法还包括步骤:
在接收要聚类色彩展示请求时,基于聚类分析的结果、为各个聚类赋予的颜色展示所述待分析数据的二维颜色矩阵。
具体地,参照图7所示,为展示的二维颜色矩阵的示意图,该二维颜色矩阵是对聚类结果的再一次聚类,并将再次聚类的结果展示在二维矩阵上,以展示聚类之间的差异。图示中每一个圆形的颜色区块代表一个聚类,即每个聚类展示为一个圆,圆的大小代表每个聚类的多少。聚类和聚类之间的差异通过聚类的颜色和代表每个聚类的圆之间的距离来表达。聚类之间的差异越大,聚类对应的颜色差别越大,代表每个聚类的圆之间的距离越远;圆形的半径越大,其对应的聚类中的数据记录越多。此外,以灰度模式展示的六边形的相互之间的灰度差别及距离远近体现出这些不同聚类之间的差别,相似的聚类,在二维矩阵上的距离也近,它们之间的六边形的数量也越少;差别大的聚类,在二维矩阵上的距离也远,它们之间的六边形的数量也越多。
本实施例提出的方法应用广泛,可以应用于各种数据的分析,提供集成多变量分类、多元数据关联、多元色彩模式辅助认识以及交互式可视化表达等。例如,某地理区间内的经济、产业、人口等数据分析、交通模式分析、用户行为分析、商业关联性分析等等需要进行聚类分析的数据都可以通过本方法实现。
本实施例提出的基于交互可视化的多维数据分析方法,在进行多维数据的分析展示时,按照确定的需要展示的属性维度,并基于上述确定的属性维度对待分析数据进行聚类分析,并且为每一个聚类赋予不同的颜色,按照确定的所述属性维度,以及各个聚类赋予的颜色,展示待分析数据的集成地图和平行坐标图,并且系统可以接收用户基于平行坐标图触发的第一交互操作,按照第一交互操作更新展示平行坐标图和集成地图,也就是说,本实施例的方案对于待分析数据中的确定的多个变量(即属性维度)进行分类,生成不同类型的专题图并展示,包括平行坐标图和集成地图,这种分类结果对于用户来说,能够从图上清楚地看出每个聚类代表什么,能够体现出类与类之间的差别,此外,用户可以根据需要对上述专题图进行动态的交互操作,系统会根据用户的交互操作对应地更新展示的专题图,实现动态有效的多维属性的交互联动和分析,并且能够有效地表达多维属性特征在空间上的分布模式及各属性维度之间的关联关系。
基于上述各个实施例提出本发明基于交互可视化的多维数据分析方法的第二实施例。参照图8所示,在本实施例中,步骤S10包括以下细化步骤:
步骤S11,获取待分析数据,基于接收到的配置请求展示属性配置界面;
步骤S12,接收用户基于所述属性配置界面设置的分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重;
步骤S13,按照设置的分类个数、需要展示的属性维度以及设置的所述权重对所述待分析数据进行聚类分析。
分析系统可以提供属性配置界面,例如,在开始进行数据分析之前,或者在接收到配置请求时,展示属性配置界面。用户基于属性配置界面选择分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重。进一步地,还可以对数据是否归一化进行配置。在属性配置完成后,可以按照配置的结果对待分析数据进行聚类分析。
基于上述各个实施例提出本发明基于交互可视化的多维数据分析方法的第三实施例。在该实施例中,在需要展示的属性维度中包含有时间维度时,在展示集成地图以及与集成地图关联的平行坐标图的同时,该方法还包括:
基于所述聚类分析的结果、为各个聚类赋予的颜色,以及时间维度的参数,展示所述待分析数据的时间矩阵图和地图矩阵,其中,所述时间矩阵图的横轴和纵轴分别为时间参数和地理区间参数,所述地图矩阵包括时间维度的各个时间对应的地图;
接收基于所述时间矩阵图或者地图矩阵触发的第二交互操作,并根据接收到的所述第二交互操作,更新展示所述集成地图、所述平行坐标图、所述时间矩阵图和/或所述地图矩阵。
现有技术中,传统GIS方法无法有效地展现多维属性特征在时间上的分布模式,该实施例提出的方法还包括对多维属性特征的分布模式的时空变化分析及展示,以解决上述问题,在上述各个实施例的基础上,实现有效地展现出多维属性特征在时间和空间上的分布模式。具体地,参照图9所示,为本实施例中的时间矩阵图,在时间矩阵图中,横向表示时间维度,纵向表示地理区间参数。在该实施例中,在展示集成地图时,可以展示时间维度上每一时间参数对应的集成地图。用户可以将界面上的光标移动到时间矩阵图上任意一点,并圈出相应的区域,那么系统会自动的在集成地图以及平行坐标图上展示出与圈出的区域对应结果。此外,当用户选择了要展示的属性维度,并将界面上的光标移动到时间矩阵图上的任意一点,能够看到该点对应的任一时间任一地理区间的属性维度对应的参数。进一步地,时间矩阵图上地理区间参数展示的排序方式并不是一定的,用户可以根据需要进行设置,例如,将相似程度高的排列在一起,或者以字母顺序排列等等。参照图10所示,为本实施例中的地图矩阵,在地图矩阵中展示了时间维度中的每一个时间参数对应的集成地图,如10所示,假设时间维度一共有三个时间参数2005、2010、2014,该地图矩阵中分别展示了这三个时间对应的集成地图,有效地展现出多维属性特征在时间这个维度上的分布。
本发明还提出一种基于交互可视化的多维数据分析系统。
参照图11所示,为本发明基于交互可视化的多维数据分析系统第一实施例的功能模块示意图。
在该实施例中,该基于交互可视化的多维数据分析系统包括:
确定模块10,用于获取待分析数据,确定所述待分析数据需要展示的属性维度;
分析模块20,用于按照确定的所述属性维度对所述待分析数据进行聚类分析;
本实施例提出的基于交互可视化的多维数据分析系统基于智能终端实现,例如,手机、平板电脑、PC(personal computer,个人电脑)等智能终端。该系统包括对多维属性空间数据的分析以及多维属性特征间的关联分析。用户将待分析的数据上传至该系统,其中,待分析数据中包括统计的各个属性维度下的数据,待分析数据中的每一条数据记录都对应地理区间上的一个空间单元。系统获取到待分析数据后,确定待分析数据需要展示的属性维度,其中,用户可以根据自己的需要选择要展示的维度,例如,数据中包含的属性维度一共有十个,而用户只想对其中三个属性维度的数据进行展示分析,则可以在分析系统的设置中选择要展示的三个属性维度。
系统根据确定的属性维度对待分析数据进行聚类分析,聚类分析是将相似的数据将对象的集合分组为由类似的对象组成的多个类的分析过程,系统衡量数据之间的相似性,将相似的数据分到一个类别中。此外,聚类分析是一种探索性的分析,在分类的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。在该实施例中,系统对待分析数据进行聚类分析得到多个聚类,将相似的数据分到同一类别中,每一个聚类中的数据具有一定的相似性。其中,得到的聚类的个数可以由用户根据需要设置,或者按照系统默认分类个数进行聚类分析。
赋色模块30,用于根据聚类分析的结果为每一个聚类赋予不同的颜色,聚类之间的差别越小,聚类对应的颜色差别越小,聚类之间的差别越大,聚类对应的颜色差别也越大;
展示模块40,用于按照确定的所述属性维度,以及各个聚类赋予的颜色,展示所述待分析数据的集成地图及与所述集成地图关联的平行坐标图;
预先设置赋色规则,赋色模块30根据聚类分析的结果为每一个聚类赋予不同的颜色。每一个聚类据聚类分析结果中其他聚类的颜色均是不相同的。参照图2和图3所示,图2为集成地图,图3为平行坐标图。这些图表中,对于同一聚类展示相同的颜色。如图3所示,以对某个地区选举情况的投票数据统计,共有三个属性维度:BUSH_PCT、KERRY_PCT及NADER_PCT。平行坐标图上每一条纵坐标代表一个属性维度。其中,在根据聚类分析的结果为每一个聚类赋予颜色时,根据聚类结果确定类与类之间的区别,根据类与类之间的差别为每个聚类赋予颜色,相似的类颜色差别小,差别大的类颜色差别也大。本实施例的系统通过这种色彩展示方式,体现出分类的差异,辅助用户更好的分析数据。
而且,平行坐标轴体现出了对多维属性维度之间的关联关系,集成地图展示了多维属性特征在空间上的分布模式。平行坐标轴上的每个轴代表一维属性(即一个属性维度),有几维属性就有几个坐标轴。聚类之后,每个聚类在平行坐标轴上都用一条线来展示,这条线在每个轴上都有一个结点,标记了这个聚类在每个属性维度上的值。聚类之间的关联关系通过代表每个聚类的线段之间的关系来表达,若两个聚类在两个坐标轴之间的线段平行,则这两个坐标轴代表的两个属性维度之间是正相关关系;若两个聚类在两个坐标轴之间的线段呈现交叉,则这两个坐标轴代表的两个属性维度之间是负相关关系。
具体地,关于展示模式,展示模块40包括:
确定单元,用于确定当前选择的展示模式,所述展示模式包括聚类模式和数据模式;
第一展示单元,用于若当前选择的展示模式为聚类模式,则获取所述待分析数据中所述各个属性维度的各个聚类数据平均值,基于获取到的所述聚类数据平均值展示所述平行坐标图,所述平行坐标图中的每条折线代表一个聚类;
第二展示单元,用于若当前选择的展示模式为数据模式,则基于所述待分析数据中所述各个属性维度的完整数据记录,展示所述平行坐标图,所述平行坐标图中的每条折线代表一条数据记录。
参照图3所示,平行坐标图即为聚类模式,每条折线只代表一个聚类,而非一条数据记录,而对于数据模式下,每一条折线代表着一条数据记录。此外,对于平行坐标图中的坐标展示方式可以有多种。参照图4所示,平行坐标图即为数据模式。进一步地,可以将聚类分析的结果基于选择的属性图维度展示对应的分类柱状图。
互动模块50,用于接收基于所述平行坐标图触发的第一交互操作,按照所述第一交互操作更新展示的所述平行坐标图和所述集成地图。
具体地,参照图5所示,用户可以基于平行坐标图触发第一交互操作,分析系统的互动模块50接收基于所述平行坐标图触发的第一交互操作,确定所述第一交互操作选择的聚类,如图5中的BUSH_PCT与KERRY_PCT轴之间的纵向黑色线条,即为第一交互操作的轨迹;展示模块40还用于在所述平行坐标图中,按照赋予的颜色和选择的所述聚类展示各个属性维度数据,按照灰度模式展示未选择的聚类的各个属性维度数据;参照图6所示,同时,展示模块40对应地在所述集成地图中,按照赋予的颜色,展示选择的聚类对应的地理区间,按照灰度模式展示未选择的聚类对应的地理区间。
此外,在其他的实施例中,关于基于平行坐标图触发的第一交互操作,还可以是对于坐标平行图上的纵坐标轴的拖拽操作,用户可以直接将鼠标放置在想要更换位置的纵坐标轴上,将其拖动到想要放置的位置,松开鼠标即可,这样可以用户可以根据需要调整坐标轴的排列顺序,以便于用户观察多个属性维度之间的关联关系,实现动态有效的多维属性的交互联动和分析。可以理解的是,上述第一交互操作也可以是触摸操作。也可以基于集成地图触发交互操作,对地图进行缩放、选择等操作。
进一步地,作为一种实施方式,展示模块40还用于在接收到聚类色彩展示请求时,基于聚类分析的结果、为各个聚类赋予的颜色展示所述待分析数据的二维颜色矩阵。
具体地,参照图7所示,为二维颜色矩阵的示意图,该二维颜色矩阵是对聚类结果的再一次聚类,并将再次聚类的结果展示在二维矩阵上,以展示聚类之间的差异。图示中每一个圆形的颜色区块代表一个聚类,即每个聚类展示为一个圆,圆的大小代表每个聚类的多少。聚类和聚类之间的差异通过聚类的颜色和代表每个聚类的圆之间的距离来表达。聚类之间的差异越大,聚类对应的颜色差别越大,代表每个聚类的圆之间的距离越远;圆形的半径越大,其对应的聚类中的数据记录越多。此外,以灰度模式展示的六边形的相互之间的灰度差别及距离远近体现出这些不同聚类之间的差别,相似的聚类,在二维矩阵上的距离也近,它们之间的六边形的数量也越少;差别大的聚类,在二维矩阵上的距离也远,它们之间的六边形的数量也越多。
本实施例提出的系统应用广泛,可以应用于各种数据的分析,提供集成多变量分类、多元数据关联、多元色彩模式辅助认识以及交互式可视化表达等。例如,某地理区间内的经济、产业、人口等数据分析、交通模式分析、用户行为分析、商业关联性分析等等需要进行聚类分析的数据都可以通过本系统实现。
本实施例提出的基于交互可视化的多维数据分析系统,在进行多维数据的分析展示时,按照确定的需要展示的属性维度,并基于上述确定的属性维度对待分析数据进行聚类分析,并且为每一个聚类赋予不同的颜色,按照确定的所述属性维度,以及各个聚类赋予的颜色,展示待分析数据的集成地图和平行坐标图,并且系统可以接收用户基于平行坐标图触发的第一交互操作,按照第一交互操作更新展示平行坐标图和集成地图,也就是说,本实施例的方案对于待分析数据中的确定的多个变量(即属性维度)进行分类,生成不同类型的专题图并展示,包括平行坐标图和集成地图,这种分类结果对于用户来说,能够从图上清楚地看出每个聚类代表什么,能够体现出类与类之间的差别,此外,用户可以根据需要对上述专题图进行动态的交互操作,系统会根据用户的交互操作对应地更新展示的专题图,实现动态有效的多维属性的交互联动和分析,并且能够有效地表达多维属性特征在空间上的分布模式及各属性维度之间的关联关系。
基于上述各个实施例提出本发明基于交互可视化的多维数据分析系统的第二实施例。在本实施例中,展示模块40还用于:获取待分析数据,基于接收到的配置请求展示属性配置界面;
基于交互可视化的多维数据分析系统还包括配置模块,配置模块用于接收用户基于所述属性配置界面设置的分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重;
分析模块20还用于:按照设置的分类个数、需要展示的属性维度以及设置的所述权重对所述待分析数据进行聚类分析。
分析系统可以提供属性配置界面,例如,在开始进行数据分析之前,或者在接收到配置请求时,展示模块40展示属性配置界面。用户基于属性配置界面选择分类个数、需要展示的多个属性维度,以及为每一属性维度设置的权重,配置模块接收用户设置的分类个数、需要展示的属性维度、以及每一维属性度的权重。进一步地,还可以对数据是否归一化进行配置。在属性配置完成后,可以按照配置的结果对待分析数据进行聚类分析。
基于上述各个实施例提出本发明基于交互可视化的多维数据分析系统的第三实施例。在该实施例中,若需要展示的所述属性维度中包含有时间维度,则展示模块40还用于:基于所述聚类分析的结果、为各个聚类赋予的颜色,以及时间维度的参数,展示所述待分析数据的时间矩阵图和地图矩阵,其中,所述时间矩阵图的横轴和纵轴分别为时间参数和地理区间参数,所述地图矩阵包括时间维度的各个时间对应的地图;
互动模块50还用于:接收基于所述时间矩阵图或者地图矩阵触发的第二交互操作,并根据接收到的所述第二交互操作,更新展示所述集成地图、所述平行坐标图、所述时间矩阵图和/或所述地图矩阵。
现有技术中,传统GIS方法无法有效地展现多维属性特征在时间上的分布模式,该实施例提出的系统还包括对多维属性特征的分布模式的时空变化分析及展示,以解决上述问题,在上述各个实施例的基础上,实现有效地展现出多维属性特征在时间和空间上的分布模式。具体地,参照图9所示,为本实施例中的时间矩阵图,在时间矩阵图中,横向表示时间维度,纵向表示地理区间参数。在该实施例中,在展示集成地图时,可以展示时间维度上每一时间参数对应的集成地图。用户可以将界面上的光标移动到时间矩阵图上任意一点,并圈出相应的区域,那么系统会自动的在集成地图以及平行坐标图上展示出与圈出的区域对应结果。此外,当用户选择了要展示的属性维度,并将界面上的光标移动到时间矩阵图上的任意一点,能够看到该点对应的任一时间任一地理区间的属性维度对应的参数。进一步地,时间矩阵图上地理区间参数展示的排序方式并不是一定的,用户可以根据需要进行设置,例如,将相似程度高的排列在一起,或者以字母顺序排列等等。参照图10所示,为本实施例中的地图矩阵,在地图矩阵中展示了时间维度中的每一个时间参数对应的集成地图,如10所示,假设时间维度一共有三个时间参数2005、2010、2014,该地图矩阵中分别展示了这三个时间对应的集成地图,有效地展现出多维属性特征在时间这个维度上的分布。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,云端服务器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
机译: 基于短距离无线通信的交互式多维数据集,以及使用相同模式的多维数据集识别方法和系统
机译: 在交互式环境中识别,分类,汇总和可视化多维数据的系统和方法
机译: 在交互式环境中识别,分类,聚合和可视化多维数据的系统和方法