首页> 中国专利> 居民用户月度电量电费异常核查方法及系统、存储介质

居民用户月度电量电费异常核查方法及系统、存储介质

摘要

本发明公开了一种居民用户月度电量电费异常核查方法及系统、存储介质,包括:获取居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;将居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的用电量信息、居民类型信息输入预先训练好的XGBoost模型进行待预测月份的月度用电量预测获得预测结果;根据预测结果调整电费异常核查规则。本发明实现对居民用户月度用电量进行预测,并根据预测结果调整电量电费核查规则,有助于电量异常数据的有效筛选。

著录项

说明书

技术领域

本发明涉及电量电费异常核查技术领域,具体涉及一种居民用户月度电量电费异常核查方法及系统、存储介质。

背景技术

当前营销系统电量电费异常核查规则主要是靠经验得来的主观规划,缺乏运营数据支撑的客观规律识别,所以常常出现如下两种困境:

1)规则阈值设定过于刚性,存在众多的假异常,有效率较低。

在现有启用规则中,其中“有可调变量”的规则达20多条,其可调变量可以分为“基准电量”和“波动率”两大类,“基准电量”和“波动率”在系统中可进行人工调整,其合理性、适用性将直接影响系统产生的异常数据量及电费核算的工作效率。根据历史数据统计,“有可调变量”的规则筛选出的异常数据占全量异常的80%以上,由此可见,若能合理、分类设置“可调变量”阈值,将对降低电费异常率,有效提高核算效率起到重要作用。

2)现有规则对用户用电异常覆盖面有限。

现有规则是基于经验得来的,其阈值的设置往往一刀切,用户用电随经济以及环境条件的变化而变化,但规则无法及时调整。一刀切的阈值设定往往无法从群体性规律性的异动中有效识别真异常。最关键的是基于规则的异常识别范围主要依赖于规则定义的范围,对于未发现规则的异常情况无法通过规则来识别,规则覆盖面有限,不能全面的识别用户用电异常。

发明内容

本发明的目的在于提出一种居民用户月度电量电费异常核查方法及系统、装置、存储介质,以实现对居民用户月度用电量进行预测,并根据预测结果调整电量电费核查规则,有助于电量异常数据的有效筛选。

为实现上述目的,本发明第一方面提出一种居民用户月度电量电费异常核查方法,包括如下步骤:

获取居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

将所述居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的用电量信息、居民类型信息输入预先训练好的XGBoost模型进行待预测月份的月度用电量预测获得预测结果;

根据所述预测结果调整电费异常核查规则。

可选地,所述截止待预测月份之前所有月份的用电量信息包括:

截止待预测月份之前所有月份的月度最大电量、月度最小电量、月度平均电量、月度电量中位数、月度电量方差,待预测月份13个月之前的月度电量,待预测月份12个月之前的月度电量,以及待预测月份11个月之前的月度电量。

可选地,所述人体舒适度计算公式为:

ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2

其中,ssd为某一月份的人体舒适度指数,t为月平均气温,f为月平均相对湿度,v为月平均风速;

其中,根据截止待预测月份之前所有月份的居民用户人体舒适度计算得到所述居民用户的月平均人体舒适度。

可选地,所述XGBoost模型的训练过程如下:

确定最近一个完整月份作为待预测月份;

获取多个居民用户样本数据,其中,每一个居民用户样本数据包括:居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

将所述多个居民用户样本数据输入原始的XGBoost模型进行训练,获得所述方法的XGBoost模型;其中,训练过程中XGBoost模型的损失函数为所述最近一个完整月份的多个居民用户的月度用电量信息与XGBoost模型训练输出的多个居民用户的月度用电量信息的误差小于预设值。

可选地,所述误差包括平均绝对误差、均方误差、均方根误差、平均绝对百分误差中的一种或多种。

本发明第二方面提出一种居民用户月度电量电费异常核查系统,包括:

信息获取单元,用于获取居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

用电量预测单元,用于将所述居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的用电量信息、居民类型信息输入预先训练好的XGBoost模型进行待预测月份的月度用电量预测获得预测结果;以及

核查规则调整单元,用于根据所述预测结果调整电费异常核查规则。

可选地,所述截止待预测月份之前所有月份的用电量信息包括:

截止待预测月份之前所有月份的月度最大电量、月度最小电量、月度平均电量、月度电量中位数、月度电量方差,待预测月份13个月之前的月度电量,待预测月份12个月之前的月度电量,以及待预测月份11个月之前的月度电量。

可选地,所述人体舒适度计算公式为:

ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2

其中,ssd为某一月份的人体舒适度指数,t为月平均气温,f为月平均相对湿度,v为月平均风速;

其中,根据截止待预测月份之前所有月份的居民用户人体舒适度计算得到所述居民用户的月平均人体舒适度。

可选地,所述XGBoost模型的训练过程如下:

确定最近一个完整月份作为待预测月份;

获取多个居民用户样本数据,其中,每一个居民用户样本数据包括:居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

将所述多个居民用户样本数据输入原始的XGBoost模型进行训练,获得所述系统的XGBoost模型;其中,训练过程中XGBoost模型的损失函数为所述最近一个完整月份的多个居民用户的月度用电量信息与XGBoost模型训练输出的多个居民用户的月度用电量信息的误差小于预设值;所述误差包括平均绝对误差、均方误差、均方根误差、平均绝对百分误差中的一种或多种。

本发明第三方面提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的居民用户月度电量电费异常核查方法的步骤。

上述的一种居民用户月度电量电费异常核查方法及系统、存储介质至少具有以下有益效果:基于预先训练好的XGBoost模型对居民用户的未来月度用电量进行预测,根据预测结果调整电量电费核查规则,根据实现异常电量波动的有效筛查,逐步降低电费差错率,精准定位异常数据,降低客服人员工作量,减少人力成本,提升工作效率。

上述的一种居民用户月度电量电费异常核查方法及系统、存储介质的其它特征和优点将在随后的说明书中阐述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种居民用户月度电量电费异常核查方法流程示意图。

图2为本发明的一个实施例中居民用户月度电量电费异常核查系统结构示意图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。另外,为了更好的说明本发明,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的手段未作详细描述,以便于凸显本发明的主旨。

参阅图1,本发明实施例提出一种居民用户月度电量电费异常核查方法,所述方法包括如下步骤:

步骤S1、获取居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

具体而言,所述截止待预测月份之前所有月份的用电量信息包括:截止待预测月份之前所有月份的月度最大电量、月度最小电量、月度平均电量、月度电量中位数、月度电量方差,待预测月份13个月之前的月度电量,待预测月份12个月之前的月度电量,以及待预测月份11个月之前的月度电量;

具体地,所述人体舒适度计算公式为:

ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2

其中,ssd为某一月份的人体舒适度指数,t为月平均气温,f为月平均相对湿度,v为月平均风速;

可以理解的是,根据截止待预测月份之前所有月份的居民用户人体舒适度计算得到所述居民用户的月平均人体舒适度;

其中,所述居民用户类型信息具体表示居民用户月度电量波动情况的类型,有些用户波动较大,有些用户波动较小,按照其历史波动情况来划分用户类型。可以根据截止待预测月份之前所有月份的月度用电量信息来确定,例如是,按截止待预测月份之前所有月份的月度最大电量、月度最小电量之间的差值来确定居民用户的月度电量波动差异,例如是波动较大用户,波动一般用户,波动较小用户三种类型,此处仅为举例说明,并不构成对本发明的限制;

步骤S2、将所述居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的用电量信息、居民类型信息输入预先训练好的XGBoost模型进行待预测月份的月度用电量预测获得预测结果;

具体而言,XGBoost作为一种新提出的基于Boosting的集成学习算法,在许多领域都取得良好结果;本实施例中考虑风速,湿度,气温等气候因素对用电量的影响,组合成人体舒适度指数,并结合历史电量建立基于XGBoost的短期电量预测模型,XGBoost模型具有并行运算速度快、精度高、灵活性强、鲁棒性好的特点,XGBoost模型预测结果能很好拟合实际电量数据,平均百分误差在2%以下;相较于线性回归、arima时间序列和随机森林方法,XGBoost电量预测模型模型训练时间短等优势,具有较好的泛化性能且不易过拟合,且具有极好的准确率,最大程度地提升居民用户月度用电量的预测精准度;

步骤S3、根据所述预测结果调整电费异常核查规则;

具体而言,根据所述预测结果可以预先估计未来居民用户的月度用电量变化情况,据此进行电费异常核查规则的更新调整,设置对应的合理阈值,相对于传统一刀切的阈值设定往往无法从群体性规律性的异动中有效识别真正异常的情况,本实施例方法根据所述预测结果调整电费异常核查规则更加的合理,能够提升异常数据的有效筛选率,有助于全面的识别用户用电异常。

举例而言,所述XGBoost模型的训练过程如下:

Step1、确定最近一个完整月份作为待预测月份;

Step2、获取多个居民用户样本数据,其中,每一个居民用户样本数据包括:居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

Step3、将所述多个居民用户样本数据输入原始的XGBoost模型进行训练,获得所述方法的XGBoost模型;其中,训练过程中XGBoost模型的损失函数为所述最近一个完整月份的多个居民用户的月度用电量信息与XGBoost模型训练输出的多个居民用户的月度用电量信息的误差小于预设值。

示例性地,所述误差包括平均绝对误差MAE、均方误差MSE、均方根误差RMSE、平均绝对百分误差MAPE中的一种或多种;

具体而言,平均绝对误差MAE计算公式如下:

其中,

MAE的范围为[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

具体而言,均方误差MSE计算公式如下:

MSE的范围为[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

具体而言,均方根误差RMSE计算公式如下:

即MSE加了个根号,这样数量级上比较直观,比如RMSE=10,可以认为回归效果相比真实值平均相差10。

RMSE的范围为[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

具体而言,平均绝对百分比误差MAPE的计算公式如下:

MAPE的范围为[0,+∞),MAPE为0%表示完美模型,MAPE大于100%则表示劣质模型。

通过以上实施例的描述可知,本实施例方法基于预先训练好的XGBoost模型对居民用户的未来月度用电量进行预测,根据预测结果调整电量电费核查规则,根据实现异常电量波动的有效筛查,逐步降低电费差错率,精准定位异常数据,降低客服人员工作量,减少人力成本,提升工作效率。

参阅图2,本发明另一实施例提出一种居民用户月度电量电费异常核查系统,包括:

信息获取单元1,用于获取居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

用电量预测单元2,用于将所述居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的用电量信息、居民类型信息输入预先训练好的XGBoost模型进行待预测月份的月度用电量预测获得预测结果;以及

核查规则调整单元3,用于根据所述预测结果调整电费异常核查规则。

示例性地,所述截止待预测月份之前所有月份的用电量信息包括:

截止待预测月份之前所有月份的月度最大电量、月度最小电量、月度平均电量、月度电量中位数、月度电量方差,待预测月份13个月之前的月度电量,待预测月份12个月之前的月度电量,以及待预测月份11个月之前的月度电量。

示例性地,所述人体舒适度计算公式为:

ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2

其中,ssd为某一月份的人体舒适度指数,t为月平均气温,f为月平均相对湿度,v为月平均风速;

其中,根据截止待预测月份之前所有月份的居民用户人体舒适度计算得到所述居民用户的月平均人体舒适度。

示例性地,所述XGBoost模型的训练过程如下:

确定最近一个完整月份作为待预测月份;

获取多个居民用户样本数据,其中,每一个居民用户样本数据包括:居民用户的月平均人体舒适度、待预测月份的月节假日天数、待预测月份的工作日天数、待预测月份的节假日天数、截止待预测月份之前所有月份的月度用电量信息、居民用户类型信息;

将所述多个居民用户样本数据输入原始的XGBoost模型进行训练,获得所述系统的XGBoost模型;其中,训练过程中XGBoost模型的损失函数为所述最近一个完整月份的多个居民用户的月度用电量信息与XGBoost模型训练输出的多个居民用户的月度用电量信息的误差小于预设值;所述误差包括平均绝对误差、均方误差、均方根误差、平均绝对百分误差中的一种或多种。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

需说明的是,上述实施例所述系统与上述实施例所述方法对应,因此,上述实施例所述系统未详述部分可以参阅上述实施例所述方法的内容得到,即上述实施例方法记载的具体步骤内容可以理解为本实施例系统的所能够实现的功能,此处不再赘述。

并且,上述实施例所述居民用户月度电量电费异常核查系统若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

本发明另一实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例所述居民用户月度电量电费异常核查方法的步骤。

具体而言,所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号