法律状态公告日
法律状态信息
法律状态
2019-04-09
授权
授权
2018-12-04
实质审查的生效 IPC(主分类):G06F17/50 申请日:20180530
实质审查的生效
2018-11-09
公开
公开
技术领域
本发明属于电动汽车充电负荷分析技术领域,具体涉及一种基于改进聚类算法的电动汽车充电负荷特征提取方法的设计。
背景技术
随着电池技术的进步,使得电动汽车的规模显著增加。对于一个家庭来说,电动汽车相比其他电器设施需要更高的充电功率,因此其充电需求在未来将相当可观。然而电动汽车的充电需求可能使社区配电系统超载,导致用户电压下降,进而导致现有的社区电网将面临前所未有的挑战。为了降低风险,需要对充电特性进行分析,电动汽车充电负荷分析可以分为两个方面:(1)基于负载生成机制进行分析,这些研究主要依赖于各种概率模型和概率算法,结果可能不准确;(2)基于数据挖掘算法的分析,通过对大量的真实数据进行聚类,然后提取用户的行为模式并分析其特征。
传统的聚类算法包括划分聚类算法、基于网格的聚类算法、密度聚类算法和基于模型的聚类算法。然而,这些聚类算法仍然存在一些问题:(1)负载数据具有规模大,维度高的特点,这对于传统聚类算法来说,意味着沉重的计算负担,尤其是考虑到未来的电动汽车大规模发展之后,这一问题将更加严峻。(2)用欧氏距离作为负荷曲线形态相似性判断的准则是不合适的,该标准可能会忽略的曲线形态上的差异从而导致不准确的聚类结果,因此,基于欧氏距离的聚类算法可能导致误分类。(3)大多数聚类算法需要预先定义聚类数目和初始聚类中心,这将导致算法结果的不稳定和不准确。
发明内容
本发明的目的是为了解决现有的电动汽车充电负荷分析聚类方法存在的上述问题,提出了一种基于改进聚类算法的电动汽车充电负荷特征提取方法。
本发明的技术方案为:一种基于改进聚类算法的电动汽车充电负荷特征提取方法,包括以下步骤:
S1、对原始电动汽车充电负荷数据进行预处理,得到充电负荷曲线。
S2、设置聚类数K和初始聚类中心Q。
S3、根据聚类数K和初始聚类中心Q对充电负荷曲线进行聚类分析,提取出电动汽车充电负荷特征。
本发明的有益效果是:本发明提出了一种提取电动汽车充电负荷特征的方法,能保持大部分形状信息,同时大大减少了维数,并可以应用到其他曲线上,同时本发明基于真实电动汽车充电负荷数据,而不是基于概率模型的数据,能够真实地反映家用电动车充电的特点,为电动汽车充电负荷分析提供了可靠的模板。
进一步地,步骤S1包括以下分步骤:
S11、数据降维:对原始电动汽车充电负荷数据进行降维处理,得到降维数据。
S12、数据修补:采用高斯滤波对降维数据中的异常数据进行平滑处理,并用三次样条插值算法对其中的缺失数据进行填充,得到修补后数据。
S13、选取特征构造充电负荷曲线:选取充电起始时间、充电持续时间及充电功率三维数据对修补后数据进行表征,构造出充电负荷曲线。
S14、标幺化:对充电负荷曲线进行标幺化处理。
上述进一步方案的有益效果是:本发明在保证形状信息完整性的同时,处理海量高维数据,减少聚类输入量。
进一步地,步骤S2包括以下分步骤:
S21、设置次数阈值L,并令聚类数K的初始值为2。
S22、判断K>L+1是否成立,若是则进入步骤S24,否则进入步骤S23。
S23、针对充电负荷曲线,运行K-prototypes聚类算法并保存聚类结果,同时令聚类数K加1,返回步骤S22。
S24、将每次K-prototypes聚类算法的聚类结果作为层次聚类算法的输入,得到层次聚类树,通过分析层次聚类树,确定最佳的聚类数K和初始聚类中心Q。
上述进一步方案的有益效果是:本发明根据数据特征本身来确定初始聚类数和初始聚类中心,减少了人工设置造成的不精确性。
进一步地,步骤S3包括以下分步骤:
S31、采用K-prototypes聚类算法中的相异度测量方法计算充电负荷曲线与初始聚类中心Q的距离,并根据距离远近进行分类,得到聚类结果。
S32、根据聚类结果对同一类的充电负荷曲线进行更新操作,得到该类充电负荷曲线新的聚类中心。
S33、判断聚类中心是否发生改变,若是则返回步骤S31,否则进入步骤S34。
S34、输出聚类结果作为电动汽车充电负荷特征提取结果。
上述进一步方案的有益效果是:本发明采用改进的相异度度量方法,可以更精确地计算混合数据之间的距离。
附图说明
图1所示为本发明实施例提供的一种基于改进聚类算法的电动汽车充电负荷特征提取方法流程图。
图2所示为本发明实施例提供的步骤S1的分步骤流程图。
图3所示为本发明实施例提供的步骤S2的分步骤流程图。
图4所示为本发明实施例提供的层次聚类树示意图。
图5所示为本发明实施例提供的步骤S3的分步骤流程图。
具体实施方式
现在将参考附图来详细描述本发明的示例性实施方式。应当理解,附图中示出和描述的实施方式仅仅是示例性的,意在阐释本发明的原理和精神,而并非限制本发明的范围。
本发明实施例提供了一种基于改进聚类算法的电动汽车充电负荷特征提取方法,如图1所示,包括以下步骤S1-S3:
S1、对原始电动汽车充电负荷数据进行预处理,得到充电负荷曲线。
如图2所示,步骤S1包括以下分步骤S11-S14:
S11、数据降维:为了减少计算时间,提高计算效率,在大量多维数据聚类时减少数据维数十分必要。本发明实施例中,通过公式(1)对原始电动汽车充电负荷数据进行降维处理,得到降维数据:
其中,n为原始电动汽车充电负荷数据的维数,m为降维数据的维数,mi表示第i个降维数据,nj表示第j个原始电动汽车充电负荷数据,i<j。
S12、数据修补:由于通信中断、信号干扰、硬件故障等情况,智能仪表采集的数据难以避免数据失真或数据丢失。因此,本发明实施例中,采用高斯滤波对降维数据中的异常数据进行平滑处理,并用三次样条插值算法对其中的缺失数据进行填充,得到修补后数据。
S13、选取特征构造充电负荷曲线:本发明实施例中,考虑到充电波形具有矩形波的特征,选取充电起始时间、充电持续时间及充电功率三维数据对修补后数据进行表征,构造出充电负荷曲线。
S14、标幺化:为避免充电功率大小对聚类效果的影响,对充电负荷曲线进行标幺化处理。
S2、设置聚类数K和初始聚类中心Q。
聚类数K和初始聚类中心Q对聚类结果有重要影响,如何确定K和Q一直是个问题。层次聚类算法是解决这一问题的一种方法,但其计算复杂度高,不适合大规模数据聚类。为了解决这个问题,本发明实施例中结合层次聚类算法和K-prototypes聚类算法,提出了一种改进聚类算法。
如图3所示,步骤S2包括以下分步骤S21-S24:
S21、设置次数阈值L,并令聚类数K的初始值为2。
本发明实施例中,次数阈值L设置为10。
S22、判断K>L+1是否成立,若是则进入步骤S24,否则进入步骤S23。
S23、针对充电负荷曲线,运行K-prototypes聚类算法并保存聚类结果,同时令聚类数K加1,返回步骤S22。
通过步骤S22-S23的反复循环,即运行了L次的K-prototypes聚类算法,然后记录下每一次聚类结果。
S24、将每次K-prototypes聚类算法的聚类结果作为层次聚类算法的输入,得到层次聚类树,通过分析层次聚类树,确定最佳的聚类数K和初始聚类中心Q。
本发明实施例中,层次聚类树如图4所示,根据图中的最大高度差可以得到最佳聚类数K,此时所对应的聚类结果即为初始聚类中心Q,如图4中各交点所示。
S3、根据聚类数K和初始聚类中心Q对充电负荷曲线进行聚类分析,提取出电动汽车充电负荷特征。
如图5所示,步骤S3包括以下分步骤S31-S34:
S31、采用K-prototypes聚类算法中的相异度测量方法计算充电负荷曲线与初始聚类中心Q的距离,并根据距离远近进行分类,得到聚类结果。
K-prototypes聚类算法中的相异度测量方法的计算公式为:
其中,d(x,y)表示对象x和对象y之间的距离,本发明实施例中,对象x为充电负荷曲线,对象y为初始聚类中心Q。ω为权重,本发明实施例中取1,A为属性集,δr(x,y)表示对象x和对象y在r属性上的距离,计算公式为:
其中,p、q表示r属性的不同取值,iδ(p,q)表示p、q的内部相似度,计算公式为:
其中iδr(cha)(p,q)表示字符型数据的内部相似度,iδr(num)(p,q)表示数值型数据的内部相似度,α与β为敏感因子,本发明实施例中取2。
aeδ(p,q)表示p、q的平均外部相似度,计算公式为:
其中,eδr(p,q)表示p、q的外部相似度,上标f表示属性集A中的第f个属性,e表示不同于f的属性,eδr(p,q)的计算公式为:
其中表示对象x的r属性的上近似,表示对象y的r属性的上近似。
S32、根据聚类结果对同一类的充电负荷曲线进行更新操作,得到该类充电负荷曲线新的聚类中心,具体更新方式为:对于数值型属性,通过累加各条充电负荷曲线对应属性值后取平均值,得到新聚类中心的数值属性值;对于字符型属性,通过计算各类字符属性值在该类中的占比,以最高占比所对应的字符为新聚类中心的字符属性值。
S33、判断聚类中心是否发生改变,若是则返回步骤S31,否则进入步骤S34。
S34、输出聚类结果作为电动汽车充电负荷特征提取结果。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
机译: 一种运动图像特征的提取方法及基于内容的运动图像搜索方法
机译: 一种基于WordNet的特征合并方法,用于文档自动分类系统的性能改进
机译: 一种生产生物聚合物纳米粒子生物胶的成分的方法,该方法证明了改进的性能特征和基于该成分的成分