法律状态公告日
法律状态信息
法律状态
2019-08-16
授权
授权
2017-03-01
实质审查的生效 IPC(主分类):G06F17/30 申请日:20160905
实质审查的生效
2017-02-01
公开
公开
技术领域
本发明涉及一种面向配网规划的海量数据多指标综合可视化方法。
背景技术
在配网规划中,数据量大,结构复杂,常常采用基于GIS的展现方式来表达配网对象的信息、状态。利用经纬度信息在地图上叠加元素点,利用点的大小、颜色等信息来表示综合指标的数值,这个数值通过综合计算与加工得出。在地图缩放时,当地图缩到较小的层级,地图可视范围内的点数据量会较大,可能会有上万个、几十万个点需要渲染,目前一般的浏览器在处理这个规模的点的渲染都比较吃力,因此,如何优化大数据量的展示,具有较大的意义。
本发明通过聚类方法,把在地图上地理位置在一定范围内比较接近的融合为一个点,点的值通过多指标的主观、客观的权重计算,得出综合的数值,点的位置通过k‐means聚类算法计算得出,这样,将点的数据级降低一个层级,能大大提高系统的性能。
发明内容
本发明的目的在于提供一种解决基于GIS的大规模配网数据可视化的合理性和性能问题,达到更佳展示效果的面向配网规划的海量数据多指标综合可视化方法。
本发明的技术解决方案是:
一种面向配网规划的海量数据多指标综合可视化方法,其特征是:(一)针对多个指标的综合值计算:假设配网对象有指标X1、X2、X3、…、Xn,同时具有经纬度坐标X、Y;赋予三个指标基于专家分析的主观权重a1、a2、…、an,同时计算基于方差贡献度的客观权重b1、b2、…、bn,通过基于最小二乘法的优化模型结合专家和方差贡献度模型计算出综合权重c1、c2、…、cn,最终得出具体的综合值
(二)地图上渲染的数量降级与优化:对于地图某一级缩放层级S,根据每个需要渲染的点的X、Y值进行分类,利用各个点之间的距离,结合缩放层级,运用k‐means聚类方法,该算法的目标是最小化对象到质心的距离的平方和,即:
假设配网对象有指标:电压合格率、线损合格率、负荷率,用X1、X2、X3、…、Xn来表示,同时具有经纬度坐标X、Y;具体步骤如下:
(1)结合业务需求,给各个指标赋予不同的权重,专家分析的主观权重设定为a1、…、an;
具体计算方法如下:
综合k个专家对各个指标的打分,可以得到每个指标Xi的平均得分为:
>
>
基于方差贡献度的方法,根据指标的相对波动大小来决定指标的权重,相对波动越大的指标具有较大的权重;
S1.选取指标体系中的m个样本,n个指标,xij代表第i个样本的第j个指标值,其中:(i=1,2,3,…,m;j=1,2,3,…,n);
S2.计算第j项指标下第i个样本的得分:
当指标有最佳值时,样本在这个指标上的得分为:
当指标没有最佳值时,且该指标为正向指标,那么样本在这个指标上的得分为:
S3.指标归一化处理,异质指标同质化;由于正向指标和负向指标的数值代表的含义不同,正向指标值越大越好,负向指标值越小越好,下面采取不同的方法将其归一化;
正向指标:
负向指标:
S4.计算第j个指标值的方差:
>
S5.计算第j个指标值的权重:
>
从而得到各个指标的客观权重b1、b2、…、bn;
为了同时考虑主观经验偏好以及客观信息的真实性,实现客观与主观的统一,应使最终求得的综合权重与主观、客观权重偏差越小越好;为此,建立最小二乘法优化模型:
>
计算出综合权重c1、c2、…、cn;式中,aj为求得的主观权重,bj为求得的客观权重,tij为不同样本各指标的得分;
根据上述运算,最终得出具体的每一个对象的综合值V1、V2、…,公式如下:
对于地图某一缩放层级S,需要渲染的每个点为P0、P1、P2…Pn,每个点的经纬度坐标为(x0,y0)、(x1,y1)、(x2,y2)…(xn,yn),通过k‐means算法按各点的距离进行聚类,具体步骤如下:
S1.根据缩放的层级,确定聚类的个数K;
S2.从所有要展示的对象中随机选取K个点作为初始质心;
S3.指派剩余的对象到离它最近的质心;
S4.利用均值等方法更新该类的中心值;
S5.重复S1、S2、S3、S4,直到K个中心点不再发生变化;
对聚类后的每一簇点,Pa、Pb、Pc…Pn,按距离远近作为权重值,计算中心点的坐标(X0,X0),值为Vc,计算步骤如下:
S1.确定样本序列
根据上面步骤的聚类结果,分别计算每一类别里各样本点与质心的距离,并按照距离从大到小进行排列,记作:
Yi=[yi1,yi2,…,yik]
其中,i是指聚类后的第i类,k是第i类包含的样本个数,
S2.确定样本修正系数
根据距离越大样本点对该类的贡献度越小的原则确定各样本点的权重,首先计算距离的倒数,即上表中的修正系数:
Y*i=[1/yi1,1/yi2,…,1/yik];
S3.确定样本权重
将S2得到的修正系数进行归一化处理,结果记作权重:
>
S4.确定各类指标值
对应类别i的每一个样本点(Xcj,Ycj)(j=1,2,…,k)有指标值Vij,综合S3计算的权重,类别i对应的指标值应为:
将最大值Vmax与最小值Vmin对应到颜色红色Vmax(rgb(255,0,0))与绿色Vmin(rgb(0,255,0)),根据对应关系,将每一个中心点的值对应到颜色,以此颜色与其经纬度坐标渲染点;具体步骤如下表:
S1.确定各类别指标值Vi*在所有指标值的位置,即计算上表
S2.按照上表分别计算各类别指标值对应的RGB值,
R值:255×(1-μi),i=1,2,…,K
G值:255×μi,i=1,2,…,K。
所述配网对象指标为电压合格率。
所述配网对象指标为线损合格率。
所述配网对象指标为负荷率。
对聚类后的每一簇点,Pa、Pb、Pc…Pn,按距离远近作为权重值,计算中心点的坐标(X0,X0),值为Vc。
本发明解决了基于GIS的大规模配网数据可视化的合理性和性能问题,达到更佳的展示效果。
下面结合实施例对本发明作进一步说明。
具体实施方式
假设配网对象有指标,如电压合格率、线损合格率、负荷率等,用X1、X2、X3、…、Xn来表示,同时具有经纬度坐标X、Y。具体步骤如下:
结合业务需求,给各个指标赋予不同的权重,如在配网运维管理中,比较关注电压合格率,那么电压合格率的权重就大一些。专家分析的主观权重设定为a1、…、an。
具体计算方法如下:
综合k个专家对各个指标的打分,可以得到每个指标Xi的平均得分为:
>
>
基于方差贡献度的方法,根据指标的相对波动大小来决定指标的权重,相对波动越大的指标具有较大的权重。
S1.选取指标体系中的m个样本,n个指标,xij代表第i个样本的第j个指标值,其中:(i=1,2,3,…,m;j=1,2,3,…,n);
S2.计算第j项指标下第i个样本的得分:
当指标有最佳值时,样本在这个指标上的得分为:
当指标没有最佳值时,且该指标为正向指标,那么样本在这个指标上的得分为:
S3.指标归一化处理,异质指标同质化。由于正向指标和负向指标的数值代表的含义不同(正向指标值越大越好,负向指标值越小越好),下面采取不同的方法将其归一化。
正向指标:
负向指标:
S4.计算第j个指标值的方差:
>
S5.计算第j个指标值的权重:
>
从而得到各个指标的客观权重b1、b2、…、bn。
为了同时考虑主观经验偏好以及客观信息的真实性,实现客观与主观的统一,应使最终求得的综合权重与主观、客观权重偏差越小越好。为此,建立最小二乘法优化模型:
>
计算出综合权重c1、c2、…、cn。式中,aj为求得的主观权重,bj为求得的客观权重,tij为不同样本各指标的得分。
根据上述运算,最终得出具体的每一个对象的综合值V1、V2、…,公式如下:
对于地图某一缩放层级S,需要渲染的每个点为P0、P1、P2…Pn,每个点的经纬度坐标为(x0,y0)、(x1,y1)、(x2,y2)…(xn,yn),通过k‐means算法按各点的距离进行聚类,具体步骤如下:
S1.根据缩放的层级,确定聚类的个数K;
S2.从所有要展示的对象中随机选取K个点作为初始质心;
S3.指派剩余的对象到离它最近的质心;
S4.利用均值等方法更新该类的中心值;
S5.重复S1、S2、S3、S4,直到K个中心点不再发生变化。
对聚类后的每一簇点,Pa、Pb、Pc…Pn,按距离远近作为权重值,计算中心点的坐标(X0,X0),值为Vc,计算步骤如下:
S1.确定样本序列
根据上面步骤的聚类结果,分别计算每一类别里各样本点与质心的距离,并按照距离从大到小进行排列,记作:
Yi=[yi1,yi2,…,yik]
其中,i是指聚类后的第i类,k是第i类包含的样本个数,
S2.确定样本修正系数
根据距离越大样本点对该类的贡献度越小的原则确定各样本点的权重,首先计算距离的倒数,即上表中的修正系数:
Y*i=[1/yi1,1/yi2,…,1/yik];
S3.确定样本权重
将S2得到的修正系数进行归一化处理,结果记作权重:
>
S4.确定各类指标值
对应类别i的每一个样本点(Xcj,Ycj)(j=1,2,…,k)有指标值Vij,综合S3计算的权重,类别i对应的指标值应为:
将最大值Vmaxn与最小值Vminn对应到颜色红色Vmaxn(rgb(255,0,0))与绿色Vminn(rgb(0,255,0)),根据对应关系,将每一个中心点的值对应到颜色,以此颜色与其经纬度坐标渲染点。具体步骤如下表:
S1.确定各类别指标值Vi*在所有指标值的位置,即计算上表
S2.按照上表分别计算各类别指标值对应的RGB值,
R值:255×(1-μi),i=1,2,…,K
G值:255×μi,i=1,2,…,K。
机译: 综合可视化指标上关键绩效指标的分析生成器
机译: 综合可视化指标上关键绩效指标的分析生成器
机译: 大量数据可视化方法和海量数据可视化系统