无论是在过去的电力中长期交易市场里,还是即将到来的电力现货交易市场里,负荷预测都是各大售电公司和电力大用户驰骋市场的必备技能。不会做负荷预测或者负荷预测做得不好,必将被无情的市场按在地板上摩擦。
在过去几年的业务发展中,汇电云联累积了70多个行业、3000多用户2年以上的一级能效数据。经过补全,清洗等ETL处理后,把用户每天的真实负荷绘制成曲线,发现真是千姿百态:有的上蹿下跳日复一日,有的一马平川偶尔会皮一下,如下图所示。
图一:不同用户的负荷曲线
负荷预测的方法,从根据用户历史耗电情况的估算,到基于统计的分析预测模型如ARIMA,再到现在大行其道的循环神经网络如LSTM及其变种,无一例外地都对稳定负荷变化有强烈的需求。负荷越稳定,规律越明显,预测的准确率就越高。这就是我们在实际操作中,会发现统调负荷预测,很轻松就能达到98%以上,而具体到单个用户的负荷预测,准确率会低到怀疑人生。
对于售电公司,预测所代理的用户总体的负荷曲线才是实实在在的需求,同时还可以深入挖掘和发展不同行业、不同用电习惯的用户,来平衡手中已有用户的总体负荷曲线。这对他们拓展业务,降低被考核风险,以及在现货市场中获利都至关重要。
汇电云联根据不同的场景需求,建立起丰富的算法模型库,在这些算法和模型库中,本着实事求是不浮夸不忽悠的科学精神,我们会陆续公布不同场景,不同数据组合,不同特征工程下的负荷预测实战结果。本期公布的是【有色金属冶炼】这个行业。
每张图展示的结果,选择的训练集都是从2018-04-01到T-1,其中T为要预测的那一天。比如要预测2018-12-23这一天24个点的负荷,训练集是2018-04-01到2018-12-23,依次类推。每张表展示是T当天的预测结果,表的最后一行是所有预测时间的平均预测结果。
在所有的模型和算法中,我们充分考虑了工作日、周末和节假日的区别,但是由于没有对用户的周末、节假日的负荷使用情况进行调研,会导致这部分时间的预测准确率比较低。图中显示的预测准确率,是从12-23到12-31这段时间的平均预测准确率,准确率评估公式是国网公布的公式,该公式相对于常用的回归算法的评估公式比如MAPE,对异常值更加敏感,意味着同一套数据,用该公式算出的准确率,会比使用MAPE算出来的准确率低一些。
图二:国网准确率评估公式
第一组算法是一组很巧妙的、取不同时间长度的数据作为自变量的算法。该算法的思想取自生产的连续性,当然也受限于生产的连续性。因此,在趋势稳定不中断的情况下,准确率相当可观,如其中12-27、12-28这两天。但对突然的减产检修等生产行为,则表现得会措手不及。
图三:方式一预测方法
第二组算法是机器学习领域的回归算法,取相似日同时刻的历史负荷值构建特征矩阵,这是一种比较直观比较传统的做法,对比较稳定的工作日的负荷预测效果,也是杠杠的好。
图四:机器学习算法组
第三组算法还是机器学习领域的算法,根据电力场景构建特有的特征,我们一共构建了有14维的特征矩阵。如下列图表所示,效果略差于第一、二组算法得到的结果。
图五:自建特征算法组
第四组算法是用不同的差异比较大的简单算法模型做的STACKING,结果也还过得去。
图六:融合算法组
从上面提供的四组算法得到的结果来看,反而是比较传统的相似日同时刻模型得到的准确率更高,而Kaggle上刷分的常胜技能STACKING,也不见得甩了其他算法几条街。另外12-30是元旦假期的第一天,预测值误差比较大,这主要是因为不同用户的节假日安排不同步造成的
本文版权归“汇电云联”所有,转载请联系作者。