You are on page 1of 2

Power Network 电网建设

短期负荷预测中坏数据的修复
夏红军,浙江省杭州市余杭供电局
摘要:该文针对电力系统负荷数据中存在大量坏数据的情况,提出了几种对坏数据定位和调整的方法。对于缺损
数据,对前一个月和后一个月提出不同的处理方法;对于奇异数据,提出了残差法、根据负荷趋势调整法以及基
于神经网络的调整方法,可以达到很好的效果,提高负荷预测的精度。
关键词:负荷预测;数据修复;坏数据;神经元
中图分类号:TM714 文献标志码:A 文章编号:1003-0867(2008)09-000-02

电力系统负荷预测是电力系统调度、用电、计划等管 量装置发生异常,或者故障后切除负荷,或者计划检修,
[1]
理部门的重要工作之一 。负荷数据主要来源于SCADA 或者数据传输过程中出现信道噪声、误码、同步偏差等问
系统,产生坏数据的原因主要是信道错误、远程终端 题。这些数据虽然都是非零值,但是它们的出现也会严重
(RTU)故障和冲击负荷。如果直接用来源于SCADA的 影响预测结果的准确性,因此对这些数据的辨识和修正是
数据进行电力系统负荷预测或系统分析,由于这些坏数据 保证预测结果可信的前提。
(数据缺损和奇异数据)的存在,预测和分析结果会受到 2.1 残差法修正奇异数据
一定程度的不良影响。本文就这个问题,对电力系统的坏 由于一周内同一时刻负荷的变化相差不会太大(温度
数据的清洗问题提出几种行之有效的方法。 变化剧烈情况除外),将每一点的真值与该点一周负荷的
平均值相比较求出差值。若该点数据为正常值,则残差会
1 对数据缺损(零数据)的校正
很小;若为伪数据,则其残差会比较大。可通过选取一适
数据缺损是由于长时间内某个测量单元的故障和某个 当的判据值k来判断是否满足所需条件。
RTU故障造成负荷数据丢失,使负荷曲线不完整,所以一 先按式(1)计算可得一周某一时刻负荷数据的平均值
般都用零数据来表示这些丢失的数据。在预测以前,必须 为Li,再按式(2)求得检测点与平均值的残差为:
对零值数据进行补充。 ΔLi = Ld+1,i - Li (2)
历史的负荷数据可分为两部分,前一个月的数据和后 以下是确定数据为伪数据的判据:
ΔLi >k×Li, k∈(0.1,0.2) (3)

一个月的数据。对于前一个月数据中的零值,由于一周内
同一时刻的负荷相差不会太大(温度剧烈变化的情况除 式中 k——判据常数。
外),就用该点一周内同一时刻负荷的平均值来代替该点 通过下式对奇异数据进行简单修正:
%
的零值。取一周某一时刻负荷数据的平均值为: ΔLd+i = Li+0.1×sign(ΔLi)×Li (4)
17
Li= Σ L , i∈{1,2…M} 式中 sign( )——符号函数。
A
(1)
7d=1 d,i
式中 M——每天的采样点数; 2.2 根据负荷趋势的方法修正奇异数据
i——缺损数据点号。 电力负荷的发展变化(即负荷趋势)具有一定的规律
对于一个月后的零值,需要分以下三种情况来考虑: 性,这是电力负荷固有的连续性和相似性所决定的。虽然
·工作日:向前追溯到非零值的同星期类型的4个点求 每天负荷的大小有差别,但负荷的变化却是有一定规律
平均值,用来代替该点的零值; 的,只要对拟合日负荷曲线的函数进行求导,就可以得出
·双休日:向前追溯到3个双休日(共6天)的同时刻类 日负荷变化率,该变化率具有一定的平稳性。本文采用基
型求平均值,用来代替该点的零值; 于负荷趋势的预测方法来计算出日平均负荷变化率,在此
·节 假 日 : 在 节 假 日 期 间 的 同 一 时 刻 求 平 均值,如 基础上对原始数据进行校正处理,具体判据如下:
“五一”期间,就取5月1日至5月7日同时刻的7个值 ΔLi>NΔLiav i点对应的负荷是伪数据
(5)
求平均值,用来代替该点的零值。 ΔLi≤NΔLiav i点对应的负荷是真数据
RURAL ELECTRIFICATION

式中 ΔL i ——所选样本日第i点的负荷变化率,ΔL i =
2 对奇异数据(非零值伪数据)的校正
(Li+1- Li)/Li;
M
奇异数据是指明显不符合负荷变化规律,在负荷曲线 ΔLiav——第i点的平均负荷变化率, ΔLiav =Σ
j=1
ΔLij/M;
上表现为不正常的错误数据,其产生的主要原因是:测 N——评价倍数,其值根据电网实际情况选取,一

2008年第9期 总第256期 
电网建设 Power Network

般取值3~5。 能作出最大的响应,而相邻节点作出较大的响应。
对于识别出的伪数据,其加工处理根据下式进行: 将每天的负荷作为一个输入矢量,将某时期的负荷
Li+1 = Li (1+ΔLiav) (6) 作为输入样本集,对Kohonen网络进行训练,每个类别的
式中 Li、Li+1——i、i+1时刻的负荷值。 特征矢量对应一条日负荷特征曲线。由于坏数据的数量
当样本中i+1时刻的负荷是伪数据时,将此伪数据用 有限,所以对于聚类结果不会有影响。设Kohonen对负荷
按式(6)计算所得的结果替换。 曲线分成s类,即产生s条特征曲线,记为:X1,…Xi,…Xs,
2.3 基于人工神经网络的奇异数据辨识 让每条特征曲线对应一个BP网络[3],共有s个BP网络,记
前面两种方法实现比较容易,但是也相对粗糙,强调 为BP 1,…BP i,…BP s。每个BP网的输入和输出层的神经元
的仅仅是奇异数据的调整,但在实际情况中很难判断哪些 数目相同,输入矢量各分量与输出矢量各分量形成一一
是奇异数据,因此还需要对奇异数据进行定位。负荷曲线 对应关系,输出分量的值指示对于的输入分量是否为坏
具有明显的相似性和平滑性,相似性指的是不同日曲线的 数据。各个BP网的结构相同。以BP1为例,输入和输出样
几个峰谷时刻基本相同,大致形状也是相似的。平滑性指 本的形成过程如下:第一,将特征曲线X 1作为一个输入
的是一条曲线的相邻点不会有大的变化(大事故情况除 样本,对应输出样本为y = (0,0,…,0)。第二,将X1的第一
外),奇异数据的存在将会破坏数据的平滑性。利用这些 个分量叠加一个偏差e,e为一正数,大小依经验而定,
特征,本文再提出一种基于人工神经网络的对坏数据进行 即X1(1) = X1(1)+e,产生一条坏数据曲线,对应输出为y=
[2]
辨识和调整的新方法。先用Kohonen网络 对日负荷曲线 (+0.5,0,0,…0)。依次对全部分量均如此处理,得到正偏
根据其相似性进行聚类,确定每一条曲线的特征曲线,然 样本集。第三,将e换成-e,+0.5换成-0.5,重复第二步,
后对BP网对特征曲线进行坏数据辨识训练,使之具有对 得到负偏样本集,至此形成BP1的训练样本集。
本类曲线中的奇异数据进行辨识的 Y 用以上方法得到所有BP网络的输入输出样本集。在
能力,最后用坏数据进行调整。 对BP网络进行训练的时候,先将所有的权值都设置成随
图 1 所 示 为 坏 数 据 的 辨 识 模 BP1 BP2 ... BP
n
机数,用上面得到的训练数据对BP网络进行训练。网络
型,输入X为被检曲线,输出Y为 训练好之后,可以应用它辨识坏数据,设定一个正常数据
与X相同维数的矢量,其中在接受 接受域[-c,c],0<c<0.5,将待检曲线输入Kohonen网络,
域内的为正常数据,否则为坏数 Kohonen网络 与该曲线相似度最高的特征曲线所对应的输出神经元值为
据。模型的第一层为Kohonen自组 1,激活相应的BP网络,以待检曲线作为BP的输入,在输
X
织特征映射网络,它的作用是将样 图1 奇异数据的辨识模型 出Y中超出接受域的分量对应的输入分量即为奇异数据分
本曲线进行分类,并给出各类特征曲线。第二层为BP子 量。
网,一次只能有一个BP子网被激活,实现坏数据精确定 在对奇异数据进行定位之后,就要进行调整。设检出
位。下面介绍各个子网具体的作用和训练过程。 曲线Xd的p点到q点为奇异数据,其特征曲线为Xt,修正后
用Kohonen对负荷数据进行模糊聚类,步骤如下: 为Xr,采用下面的公式对坏数据进行调整:
设输入的神经元个数为m,m的取值应略大于模式 X (p - 1) Xt(p - 1)
/2

Xr(i) = Xt(i) + Xd + X (p - 1) i = p,p + 1,…q (7)


类别数,对所有的从输入节点到输出节点的连接权值ω ij t(p - 1) d

都赋予随机数,时间计数t=0;输入矢量X = (x 1 ,x 2 ,…, 通过以上的方法,基本可以完成对电力系统负荷数据


x n) ; 计 算 X 与 全 部 输 出 节 点 所 连 接 权 值 的 欧 氏 距 离 中的坏数据进行定位和调整,提高负荷预测的精度。
n
2
dj = Σ
i=1
(xi - ωij) ,其中i∈{1,2,…,n},j∈{1,2,…,m};
参考文献
具有最小距离的节点N j 竞争获胜,调整以输出节点
N j为中心的几何邻域内节点所连接的权值Δω ij = η(t)(x ki - [1] 牛东晓,曹树华,赵磊,等. 电力系统负荷预测技术及其
应用[M]. 北京:中国电力出版社,1998.
ω ij),其中,η为学习率,0<η<1,是t的非降函数,随着t
[2] J.P.Marques de sa. 模式识别-原理、方法及应用[M]. 清华
的增加,邻域逐渐收缩,最后只包含Nj;
大学出版社, 2002.
若还有输入样本数据,那么t = t + 1,转步骤(2)。 [3] A.G.Baklrtzls, V.Petrldls, S.J.Klartzis, M.C.Alexladls,
RURAL ELECTRIFICATION

训练过程结束后,每一个输出节点所连接的权矢量即 A.HMalssls. A Neural NetWork Short Term Load Forecasting Model


为该节点所代表的模式类别的特征矢量。几何上相近的输 For the Greek Power System[J]. IEEE Transactions on Power
System, 1996,11(5):858~863.
出节点代表了特征上相近的模式类别,其特征矢量也较为
(责任编辑:袁航)
相近,即欧氏距离较小,这保证了对以输入模式获胜节点

 2008年第9期 总第256期

You might also like