前言

题目: Review on probabilistic forecasting of photovoltaic power production and
electricity consumption
期刊: renewable and sustainable energy reviews 2018
论文地址:Review on probabilistic forecasting of photovoltaic power production and
electricity consumption
目录
Abstract

一方面,光伏(PV)系统在建筑环境中的渗透率越来越高,另一方面,电力消耗的随机性日益增加,例如电动汽车(EV),因而,准确预测变得更加重要和更具挑战。
本文重点介绍了以下两个方面:
- 太阳能概率预测(PSPF)和负荷预测(PLF)领域的最新进展。一个重要的发现是:没有一种特定的模式可以适用于任何情况!
- 分析现有技术并评估不同方法的性能,以及这些方法在何种程度上可以推广,以便它们不仅在其设计的数据集上表现最佳,还可以在其他数据集或不同的案例研究上使用。
Keywords
Probabilistic forecasting 概率预测
Electricity consumption 电力消耗
Photovoltaic 光伏
Solar radiation 太阳辐照
Irradiance 辐照度
Prediction interval 预测区间
1. Introduction

全球变暖正在加剧,为了实现碳排放量的减少,向太阳能和风能等可再生能源(RES) 转型势在必行。并且依据目前数据来看,太阳能发电在很多国家已经有了一定规模了。

此外,研究发现随着光伏集成度的增加可能会出现一些问题,例如电压波动,馈线负载,电网损耗和增加的短路电流[10,11]。此外,经过文献综述,Ropp等人[12]得出结论,40-50%的分布式发电(DG)穿透水平可能导致由于云层变化,孤岛变化和短路电流增加引起的异常电压波动的严重问题。因此,为了减少待机的常规发电厂的数量和由于不确定性和错误预测而产生的成本,准确的光伏发电或太阳辐照度预测对于可再生能源正确地集成到发电组合中变得越来越重要。尽管该主题存在大量研究,但仍被认为相对不成熟[13]。
总结:光伏集成度增加会导致一些问题出现,准确的光伏发电以及太阳辐照度预测很重要,但该领域现阶段不是很成熟。

另一方面,已知电力消耗是可以预测的,并被视为一个成熟的领域[13],大中型公用事业在日前市场中实现 3 %或更低的预测误差[25]。然而,随着智能电网的出现,出现了新的问题,特别是与需求响应(DR)和需求侧管理(DSM)相关的问题。这些技术允许消费者基于例如在非高峰时段降低购买关税的价格激励来转移他们的电力消耗,并且因此,这给电网运营商带来了新的挑战。 Hong和Fan发现,在这种情况下,公用事业公司将需要执行一次预测和两次预测,因为需要从受价格激励影响的模式中辨别出正常的消费模式[26]。最近,动态需求响应或D2R这一术语是由Aman等人创造的,这意味着通过智能电表数据的出现,需求响应将变得更具动态性,这反过来将在住宅负荷预测方面带来额外挑战。具有高时间分辨率往往更具波动性[27]。
总结:电力消耗的预测被认为是一个相对成熟的领域。但SG的出现带来了需求响应与需求侧的管理的问题,需求响应将变得更加具有动态性。


传统上讲负荷预测按极短期负荷预测(VSTLF)、短期负荷预测(STLF)、中期负荷预测(MTLF)和长期负荷预测(LTLF)进行划分,预测区间分别为1天、2周、3年和30年。但是也有一些更为粗略的划分,比如只是分为短期和长期,还有的分为STLF、MTLF和LTLF,预测窗口分别为1小时到1周、1周到1年和1年以上,这个标准并不是固定的。
但LTLF通常被认为对决策者和传输系统运营商(TSO)感兴趣,此外,由于欧盟(EU)总能耗的 40%是由建筑物造成的[32],因此一些评论报告侧重于建筑物能耗预测[33,34,35,36]。

这一段总结了前面提到的几篇论文具体干了些什么事情。我认为值得注意的有:
- [26]中讨论了17篇负荷预测文章,之后他们将重点放在了他们认为以前没有做过的概率负荷预测(PLF) 上,说明PLF涉及的人还不是很多。
- [23]以及[36]发现了一个趋势,尽管人工神经网络(ann)仍然是目前使用最多的对辐照度和负荷进行预测的模型,但梯度增加,随机森林和支持向量机在科学界得到越来越多的关注。
- [22]评估并比较了三种不同类型的ann在预测中国日全球辐照量方面的性能。他们发现,精度强烈地依赖于模型和位置,有时产生显著不同的结果,但总体多层感知器(MLP)和径向基神经网络(RBNN)优于其余的神经网络和物理模型。

这里多次提到了 ‘‘net demand’’ 一词,即净需求。在城市和住宅区净需求预测变得很难,一方面是因为光伏系统的细节,比如倾斜和方位角等。另一方面的原因是人们的各种行为是随机的,比如用电习惯等等之类的。
本文分别回顾了在不同时间范围内对太阳能(PSPF)和负荷(PLF)进行概率预测的最新进展,以描绘出将PSPF和PLF结合用于净需求预测的机会。本文首先是概述了最先进的太阳辐照度和光伏功率预测,然后概述了最先进的负荷预测,特别关注城市和居民用电。这两种情况下重点都放在概率预测。因为与预测性预测相比,它传达了更多有关未来发电和消费的信息。


因此,说了这么久,本文的目的终于浮出水面:
- 提供PSPF和PLF的性能指标,方法和最新进展的广泛概述。
- 发现研究差距。
- 找到PSPF和PLF之间的共同点,为净需求预测开辟道路。
- 评估了对上述性能指标进行标准化的必要性。

本段说明了接下来几部分的内容,可以总结如下:
- 第二部分介绍了确定性预测和概率性预测的一些基本定义、模型以及性能指标。概率预测的均值可以被解释为确定性预测。
- 第三部分概述了当前比较常见的用于PSPF和PLF的预测技术,并且着重讨论了非参数统计技术。因为参数化方法倾向于将确定性预测修饰成概率预测, 而确定性模型超出了本文的讨论范围。此外,非参数统计方法可用于直接预测,也可从确定性物理模型(如NWP)中创建概率预测。
- 第四部分在使用的方法、预测范围和空间和时间分辨率等方面对PSPF和PLF进行了比较。
- 第五部分是总结。
2. Basic definitions and comparison models
本节介绍有关空间和时间范围以及分辨率的基本定义,阐述确定性和概率性预测之间的差异,并概述确定性和概率性预测的比较模型和性能指标。
2.1. Spatial and temporal horizon and resolution
任何预测的准确性都受到空间和时间范围和分辨率的极大影响,这里面涉及到四个参数:空间范围、空间分辨率、时间范围以及时间分辨率。 图 1 说明了统计和物理方法的空间和时间分辨率,如下所示:

横轴为时间分辨率,纵轴为空间分辨率,蓝色代表负荷预测,红色为太阳能预测;实线为统计方法,虚线为物理方法。观察发现,红色相比蓝色充满更多变化,也就是说太阳能预测 (SPF)的方法存在比负荷预测更多的变化。同时负荷预测很少使用物理方法,but这并不意味着不考虑诸如温度的物理变量,因为这些变量对电力消耗具有显着影响。

其次,尽管 SPF(太阳能预测)存在几种物理方法,但很少有j将它们用于概率SPF(PSPF) ,但依然存在。比如NWP(数值天气预测)预测以某些初始和边界条件运行。为了创建PSPF,可以调整这些条件并根据后续预测构建概率密度函数(PDF) 。由于NWP模型的计算要求很高,因此这是一个耗时的过程。

2.2. Deterministic forecast vs. probabilistic forecast
2.3. Clear sky models, and clear sky and clearness indices
2.4. Benchmark methods
一个典型的基准方法是概率预测的非参情况,确定性预测的基准方法通常是持久性模型。
2.4.1. Benchmarks for deterministic forecast
本节讲述确定性模型的基准,也就是上面说的持久性模型。首先是太阳能预测:


持久性预测又称为朴素预测器。假设时间t的条件将持续到时间段t+h,这种方法在几秒甚至几分钟预测范围内非常有效,但当预测范围增加到一小时甚至超过一小时,其效果会大大降低。此外,预测技能得分公式S用来衡量所提出的模型与持久性方法相比的相对的改进。 S为0,意味着没有改进,即不确定性与可变性一样大,这是持久性预测中的情况。S大于零,则可以认为是有效的,而S≤0意味着应该拒绝所提出的模型,因为不确定性大于可变性。
持久化方法可以表述为:

这里是 x ~ t + h \tilde{x}_{t+h} x~t+h预测值, x t x_{t} xt是感兴趣的时间序列在t+1时刻的测量值,例如晴空指数。

虽然持久性是最常见的基准方法, 但最近又提出了另一种类似的方法, 称为智能持久性。不是让预测范围h的预测值 x t + h x_{t+h} xt+h完全取决于当前观察值,智能持久性将先前h观察的平均值考虑在内。这可以表述为:
x ~ t + h = m e a n [ x t , . . . , x t − h ] \tilde{x}_{t+h}=mean[x_{t},…,x_{t-h}] x~t+h=mean[xt,…,xt−h]

还有一种气象学采用的基准—–气候学模型。与持久性模型及其在较短的提前期(即预测范围)中的应用相比,气候学模型通常难以在较长的预测范围内表现出色,因为它考虑了所有测量的平均值。它的形式如下:
x ~ t + h = m e a n ( x t ) \tilde{x}_{t+h}=mean(x_{t}) x~t+h=mean(xt)

有两点需要注意:
- 尽管气候学模型可以应用于点预测,但这种情况并不常见。然而,它在概率预测中经常作为基准模型使用, 因为有可能根据过去观测的分布构建无模型分布,我们将在下一节中展示。
- 其它完善的方法,如自回归积分移动平均(ARIMA)有时也被用作基准,这将在下一节中更详细地解释。
2.4.2. Benchmarks for probabilistic forecast
2.5. Performance metrics
2.5.1. Deterministic forecasting
2.5.2. Probabilistic forecasting
ϵ i = { 1 i f x i ∈ [ L i , U i ] 0 i f x i ∉ [ L i , U i ] \epsilon_{i}=\left\{ \begin{array}{rcl} 1 & & {if\ x_{i} \in [L_{i}, U_{i}]}\\ 0 & & {if\ x_{i} \notin [L_{i}, U_{i}]} \end{array} \right. ϵi={
10if xi∈[Li,Ui]if xi∈/[Li,Ui]
其中 L i L_{i} Li和 U i U_{i} Ui分别代表预测区间的下限和上限。根据 ϵ i \epsilon_{i} ϵi的公式,我们可以推断出PICP高就意味着更多的结果位于预测区间的范围内,这显然是好的。PICP度量是可靠性的定量表达,应该高于标称置信水平,因为它们是无效的并且应该被丢弃[65]。

然而,如果仅基于PICP分析预测的质量,则可以在下限Li和上限Ui之间选择宽范围,以便人为地改善覆盖概率,而预测的方差可以是不可取的,决策者提供的信息很少。事实上,预测区间的信息量由它们的宽度决定[64]。 因此,应该用预测区间归一化平均宽度 (PINAW)同时分析 PICP,这是一种定量评估预测区间宽度的度量。PINAW 定义如下[64]:

P I N A W = 1 N R ∑ i = 1 N ( U i − L i ) PINAW=\frac{1}{NR}\sum_{i=1}^{N}(U_{i}-L_{i}) PINAW=NR1i=1∑N(Ui−Li)
其中R表示预测区间平均宽度的归一化,并表示最大预测值减去最小预测值。

Khosravi等人[66]注意到PICP和PINAW通常具有直接关系,其中预测间隔(PINAW)的高宽度意味着结果的高覆盖率(PICP) ,因此提出了同时评估两者的定量测量。尽管作者将其命名为基于覆盖长度的标准(CLC),但后来它被重命名为基于覆盖宽度的标准 (CWC) ,参见例如[64]。 CWC的表述如下[64]:

C W C = P I N A W ( 1 + γ ( P I C P ) e − η ( P I C P − μ ) ) CWC=PINAW(1+\gamma(PICP)e^{-\eta(PICP-\mu)}) CWC=PINAW(1+γ(PICP)e−η(PICP−μ))
其中η和μ是控制参数,训练期间 γ(PICP)=1。参数μ表示在训练阶段期间要实现的预分配的PICP,并且为了选择该参数,标称置信水平[(1−α)%]可以用作指导。此外,η是一个惩罚项,如果不满足预分配的 PICP,将导致CWC指数增长。当PICP≈μ时,人们已经实现了PICP和 PINAW之间的平衡,并且可以继续测试模型[64]。 然后,根据μ确定具有 γ(PICP)的CWC,其公式如下:
γ ( P I C P ) = { 0 i f P I C P ≥ μ 1 i f P I C P < μ \gamma(PICP)=\left\{ \begin{array}{rcl} 0 & & {if\ PICP \geq \mu}\\ 1 & & {if\ PICP < \mu} \end{array} \right. γ(PICP)={
01if PICP≥μif PICP<μ

在测试阶段,使用式(2.42)比较CWC。如果PICP低于预先指定的PICP,则CWC增加。CWC的目标是在预测间隔[64]的信息量(PINAW)和覆盖概率(PICP)之间进行折衷,并且可以解释为信息和覆盖范围之间的最佳平衡。


可靠性和锐度是概率预测的重要特性,但由于它们可以进行图形评估,因此对解释很敏感,这反过来可能导致主观结论,特别是在比较方法时[63]。因此,引入了要求适当的技能分数或评分规则,即确保最佳预测获得最高得分的分数。在下文中,将讨论三个度量,即连续排名概率得分(CRPS) ,弹球失控函数和温克勒得分。

CRPS是一个强大的分数,其设计方式可以衡量可靠性和锐度。CRPS的一个优点是,如果预测是确定性的,它会降低到绝对误差,因此这个分数允许在概率和点预测之间进行比较[57]。CRPS可以如下表达[57]:

C R P S ( F , x ) = ∫ − ∞ + ∞ ( F ( y ) − 1 x < y ) 2 d y = E F ∣ X − x ∣ − 1 2 E F ∣ X − X ′ ∣ CRPS(F,x)=\int_{-\infty}^{+\infty}(F(y)-1{x
CRPS(F,x)=∫−∞+∞(F(y)−1x<y)2dy=EF∣X−x∣−21EF∣X−X′∣
其中1是Heaviside 阶梯函数,x代表观测值,X和X’是具有累积分布函数(CDF)预测F和有限一阶矩[57]的独立随机变量。 CRPS的另一个优点是它具有与预测变量相同的单位[57],这提高了分数的可解释性。此外,由于其与绝对误差的关系,低 CRPS 表示准确的概率预测。
最后,从式(2.43)可以看出,CRPS考虑了预测的整个分布,这与将在下一段中讨论的弹球损失函数形成对比。

与CRPS类似,弹球损失函数兼顾可靠性和锐度,专门用于分位数预测[26],将在第3节中进行解释。定义如下[67]:

L τ ( x ~ τ , x ) = { ( 1 − τ ) ∣ x ~ τ − x ∣ i f x ~ τ ≤ x τ ∣ x ~ τ − x ∣ i f x ~ τ ≥ x L_{\tau}(\tilde{x}_{\tau}, x)=\left\{ \begin{array}{rcl} & (1-\tau)|\tilde{x}_{\tau}-x| & & {if\ \tilde{x}_{\tau} \leq x}\\ & \tau |\tilde{x}_{\tau}-x| & & {if\ \tilde{x}_{\tau} \geq x} \end{array} \right. Lτ(x~τ,x)={
(1−τ)∣x~τ−x∣τ∣x~τ−x∣if x~τ≤xif x~τ≥x
其中 x ~ τ \tilde{x}_{\tau} x~τ是观测值x的分位数 τ \tau τ的预测值。在计算每个分位数后, 这些可以在预测范围内求和以获得弹球损失[26]。值得注意的是,式(2.45)中定义的函数在分位数回归的情况下应最小化。低弹球得分表示准确的概率预测模型[26]。此外,在预测范围内平均所有分位数上的弹球损失会产生分位数分数[68]。

Winkler评分[69]允许同时评估可靠性和锐度,类似于CRPS和弹球损失函数。令(1−α)为标称概率,则Winkler分数定义为[49]:

S c i = { δ i f L i ≤ x i ≤ U i δ + 2 ( L i − x i ) / α i f x i < L i δ + 2 ( x i − U i ) / α i f x i > U i Sc_{i}=\left\{ \begin{array}{rcl} & \delta & & {if\ L_{i} \leq x_{i} \leq U_{i}}\\ & \delta+2(L_{i}-x_{i})/ \alpha & & {if\ x_{i}
U_{i}} \end{array} \right.
⎨
⎧δδ+2(Li−xi)/αδ+2(xi−Ui)/αif Li≤xi≤Uiif xi<Liif xi>Ui
其中 δ = U i − L i \delta=U_{i}-L_{i} δ=Ui−Li其中 L i L_{i} Li和 U i U_{i} Ui表示前一天计算的预测区间的下限和上限。 从式(2.46)可以看出,当观察位于预测区间之外时,分数增加,并且当误差增加时,错误预测会受到更多惩罚。 此外,较低的Winkler分数因此代表更好的概率预测。为了评估整体表现,平均 Winkler评分可以定义为:
S c i ‾ = 1 N ∑ i = 1 N S c i \overline{Sc_{i}}=\frac{1}{N}\sum_{i=1}^{N}Sc_{i} Sci=N1i=1∑NSci
总结如下:

未完待续!
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/216894.html原文链接:https://javaforall.net
