半月刊

ISSN 1000-1026

CN 32-1180/TP

+高级检索 English
网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于边缘计算的低压用户窃电检测

  • 郑应俊 1
  • 杨艺宁 2
  • 舒一飞 3
  • 薛阳 2
  • 刘爱国 3
  • 苏盛 1
1. 长沙理工大学电气与信息工程学院,湖南省长沙市 410004; 2. 中国电力科学研究院有限公司,北京市 100192; 3. 国网宁夏电力有限公司营销服务中心(计量中心),宁夏回族自治区银川市 750001

最近更新:2022-06-09

DOI:10.7500/AEPS20210624008

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

低压用户窃电导致线损电量增加,对台区线损异动进行归因分析是识别窃电用户的有效途径。低压用户通信异常多发,可导致用电信息采集系统主站数据失真,易误导窃电检测。利用配变终端可就地完整准确采集台区数据的特点,提出基于边缘计算的低压用户窃电检测方法。首先,在通信正常和异常的条件下,分析台区窃电用户用电量与线损电量的关联关系;然后,在配变终端窃电检测模块中对真实的台区线损和用户用电量进行归因分析来识别窃电用户;最后,基于高损台区实际数据的仿真分析,验证了所提方法相比于在主站侧采用异常数据以及采用不同缺失数据填补算法修复后的数据进行窃电检测时的优势。

0 引言

低压用户窃电是长期存在的痼疾,除直接导致供电企业利润流失外,窃电用户私拉乱接还是造成触电等人身伤亡事故的重要诱

1-3。因为数量庞大且用电行为模式多元,低压用户的窃电检测一直没有得到很好的突4

智能电表的普及应用为开展数据驱动的窃电检测奠定了坚实基础。文献[

5]结合最大信息系数与密度峰值快速聚类算法来检测窃电。文献[6-7]基于每个用户前后多日负荷标准差的波动性指标、负荷序列升降的趋势性指标以及用户多日的负荷均值差值和变化斜率的变动性指标,采用改进后的离群因子算法来检测异常用户。针对特征提取影响异常检测准确率的问题,还可采用堆叠去相关自编码器提取高度凝练的独立特征,再利用支持向量机判断用户异8。供电企业稽查人员有限,误报率是评价窃电检测算法实用性的核心指9。工程应用中为避免误报,往往面向高损台区进行用电检查,以提高稽查靶向性。文献[10]利用多数窃电手段下异常用户窃电量与计量电量相关的特点,采用Granger因果分析检测造成线损异常波动的用户。此外,利用台区高损与用户计量异常具有关联性的特点,也可以通过其他信息的关联分析来实现低误报率的窃电检11

需要指出的是,台区低压用户通信异常多发,通信失败后常延迟几天后一次报送多日电量。根据主站数据统计台区线损电量时,用户数据报送失败当日会造成台区异常高损,而补报电量时又会造成台区低损甚至负损。现有窃电检测方法以数据完整准确为前提,采用失真数据进行窃电检测易导致错误结果,阻碍低压用户窃电检测工作的开展。

针对因台区数据缺失而无法进行准确窃电检测的问题,提出一种基于边缘计算的低压用户窃电检测方法。首先,比较分析了缺失数据的补全方法;然后,在通信正常和异常的条件下,分析台区窃电用户用电量与线损电量的关联关系,并利用台区智能终端(intelligent terminal of distribution substation,ITDS)可完整准确地就地采集用户数据的特点,提出基于边缘计算的低压用户窃电检测框架;最后,基于实际含窃电用户台区数据,验证了所提方法相比于在主站侧采用异常数据以及采用不同缺失数据填补算法修复后的数据进行窃电检测时的优势。

1 电力缺失数据补全方法

由于量测数据在测量与采集、传输与转换等各个环节均有可能受到干扰甚至发生故障,因此数据缺失错漏是电力系统长期存在的问题。传统上,对于电网冗余配置量测的状态量,可以在实现状态估计可观性的条件下采用伪量测的方式代替少数缺失数据。智能配用电系统中,用户用电数据同样存在数据缺失错漏的情况。此类数据难以用状态估计填

12,传统方法主要采用均值填补、最近距离填补、多重插补、回归模型和基于最大期望算法等补全模13,这些处理方法多基于数理统计和机理分析构造数学模型,对用户侧缺失数据的重建效果并不理想,忽视了电力系统中量测的相关性和时序特14-15,影响了基于重建数据进行决策分析的合理性。

由于缺失数据填补在很多科学和工程领域都有广泛的应用,近年来科研人员围绕该问题开展了大量研究并取得了较大进

16-17。在Netflix推荐系统运用的矩阵填充方法建立在数据矩阵具有低秩性和稀疏性的前提下,可以在原始数据部分丢失的异常情况下,准确重构原始矩阵。低秩矩阵补全理论是基于数据本身的低秩性恢复缺失数据,它将矩阵秩最小化作为目标函数,经典的数据恢复数学模型为:

minK K*s.t.    PΩ(M)=PΩ(K) (1)
PΩ(M)=Mi,j        (i,j)Ω0             (i,j)Ω (2)

式中:*表示矩阵核范数;K为恢复后的低秩矩阵;M为只观测到部分元素的待修复矩阵;ΩM中非空元素位置集合,若矩阵M的元素Mi,j被观测到,则有(i,j)ΩPΩ()为算子。由于实际系统一般存在高斯噪声和尖峰等形式噪声,考虑含噪声的实际数据的数据恢复模型如式(3)所示。

minK,E,G  K*+ρE1+δGF2s.t.    PΩ(M)=K+E+G+N (3)

式中:E为尖峰异常值矩阵;G为高斯噪声矩阵;ρδ为相应的权重系数;F表示F范数;N为辅助矩阵。求出式(3)中的增广拉格朗日函数并将其转化为无约束优化问题后,可根据文献[

18]采用交替方向乘子法(alternating direction method of multipliers,ADMM)求解,不再赘述。

建立在矩阵填补基础上的张量填补,实际上是一种高维矩阵填补。由于多个用户在不同日的用电数据可能具有潜在的多维内在相关性,采用张量填补可利用更宽维度上的信息提高缺失数据填补效果,并已在低压台区缺失数据上得到成功应

19。张量填补的基本原理与矩阵填补类似,详见文献[19]。

与矩阵填补和张量填补利用数据本身的低秩性恢复缺失数据不同,生成对抗网络(generative adversarial network,GAN)方法采用数据驱动的方式,通过GAN的对抗博弈对大量无标签数据进行特征提取训练,获得能够准确识别数据真假性的判别模型和捕获数据潜在特征与时空分布特性的生成模型。然后,采用双重语义感知约束重新训练模型,找到与含缺失值的待重构数据拥有最大相似性的备选数据,即可将其对应位置数据填补缺失部分数

20。需要指出的是,GAN方法需要从大量数据样本中抽取数据的分布特性才能保证填补效果,对于单个台区用户缺失计量数据填补的适用性不强,本文采用矩阵填补和张量填补进行失真数据的填补。

2 基于边缘计算的低压台区用户窃电检测

2.1 低压台区用户电量与线损电量的关联性分析

配电台区非技术线损主要由窃电所致,非零电量窃电用户的窃电量与电表计量电量大多呈正相关,这会使得线损电量与窃电用户计量电量之间存在潜在的因果关联。因此,可用归因分析识别台区线损与接入用户计量电量的相关性,以识别嫌疑用户,提高窃电稽查的靶向性。

采用某实际高损台区数据分析用户电量与线损电量间的关联性。该高损台区62天的实际线损电量如图1所示,台区日均供电量约为1 200 kW∙h,接入6个工商业用户和33个低压居民用户。2020年1月至2月间,日均线损电量约为100 kW∙h,线损率达到9.6%,不属于正常范围,可认定存在异常用电行为。因接入的工商业用户窃电影响和用电量显著高于居民用户,采集2019年12月30日至2020年2月29日间日线损电量G及工商业用户1至6的日电量H1H6进行分析。

图1  高损台区接入用户用电量及线损电量

Fig.1  Electricity consumption of users and line loss power in high-loss distribution area

图1可见,整体上高损台区线损电量曲线与接入用户电量的趋势相似,均呈先升后降的形态。如果能找出用电量与线损电量因果关联性最高的用户,那么就可将其识别为窃电嫌疑最大的用户。

2.2 低压台区数据通信及异常分析

ITDS一般安装于配电房二次

21,在台区内采用RS485或载波通信,系统主站采用无线专网或光纤通信,将采集的配变自身和台区低压用户计量数据向主站报22-23。台区通信架构如图2所示。

图2  配电台区通信架构

Fig.2  Communication architecture of distribution area

实际系统中,用户通信失败延后1至2天上报数据的情况多发。为呈现通信异常对主站数据的影响,随机选取1.1节高损台区的任一工商业用户(如用户1)在某一天(如2020年1月29日)报送电量异常并在次日补报,实验结果如图3所示。在通信异常日,线损电量和线损率会因为少报电量而突增,而在次日又会因为一次报送异常用户2天的电量而骤降甚至出现负线损。通信异常使得主站侧线损电量发生畸变失真。采用主站侧失真数据进行窃电检测,可能打破窃电用户计量电量与线损电量之间的因果联系,使窃电检测产生错误的结果,难以准确识别窃电用户。

图3  通信异常时用户用电量及线损电量

Fig.3  Electricity consumption and line loss power with communication anomaly

2.3 配电台区边缘计算与窃电检测框架

经济学中常用协整检验与Granger检验来分析时间序列间的相关性。一般先采用协整检验检测序列间是否存在长期的均衡关系,然后采用Granger检验判断一个变量能否对另一变量产生影

24-26。考虑到多数窃电方式下异常用户窃电量与计量电量呈正相关,异常用户窃电引起的台区损耗波动与经济变量类的时间序列在受到其他因素干扰时的变化具有相似性。因此,可利用台区线损电量与用户电量两者间的均衡关系及因果联系,检测引起台区线损异常的用户。

传统上,受现场终端计算资源约束,只能将业务功能集中部署于中心主站等核心节点,系统性能取决于通信网络和主站的性能水

27。近年来,物联网终端的爆炸性增长和应用多元化带来了海量数据,在传输带宽和时效性上对中心化的数据处理方式提出了严峻挑战。计算机技术的发展使得边缘侧终端具备较强的计算处理能力,在靠近物联网终端以边缘计算的方式就近提供服务,可减少数据传输量,降低服务响应时延,增强网络效28-29

ITDS是边缘计算技术在配用电系统应用的典范。它作为服务台区的综合平台,可以在边缘侧基于台区基础数据提供线损分析、电能质量监控、拓扑分析和户变关系分析等业务。因为不同业务功能模块可能由各厂家按存在差异的系统环境设计实现,需要采用容器技术支撑软、硬件解耦,从而在同一平台上实现不同厂家的业务系统功

30。基于容器技术的ITDS包含系统层和应用程序(APP)层。APP层分为采集APP和业务APP,相互间可通过消息总线交互。采集APP可采集台账数据、实时运行数据和负荷数据;业务APP通过设备总线访问数据中心,提取所需数据进行计算分析,实现业务功能的边缘计31

结合2.1节的低压窃电用户与台区线损关联分析与2.2节的配用电物联网边缘计算架构,提出基于边缘计算的低压用户窃电检测方法。该方法的核心是利用ITDS的集中器APP就地获得台区用户计量数据,然后线损APP根据台区供电量和用户电量分析线损电量,最后在窃电检测APP中对台区线损和用户电量采用Granger归因分析或其他算法来识别窃电用户,并将检测结果上传至云端,实现流程如图4所示。本文所提方法将窃电检测从主站系统迁移至边缘侧进行,能够釜底抽薪地规避通信异常引起的数据失真问题,从而充分发挥窃电检测算法准确识别低压台区异常窃电用户的效能。

图4  基于边缘计算的窃电检测框架

Fig.4  Electricity theft detection framework based on edge computing

3 异常检测算例

首先根据1.1节中高损台区实际数据,采用Granger归因分析方法进行窃电检测测试分析,然后将主站侧失真数据和失真后经矩阵填补和张量填补的数据进行对比测试。

3.1 边缘检测测试算例

在边缘侧对G、H1H6及其差分序列分别完成单位根(ADF)检验。以5%的置信度为标准,序列均为一阶单整序列,检验结果见附录A表A1。

分别对GH1H6采用Engle-Granger协整检验,再通过ADF检验对残差序列完成平稳检测,残差序列平稳性检测结果如表1所示,表中红色数字表示检验值小于检验阈值-3.436 3。

表1  用户与线损电量的残差序列平稳性检验结果
Table 1  Residual sequence smoothness test results of user and line loss power
用户检验结果用户检验结果
H1 -3.157 3 H4 -5.748 0
H2 -3.373 8 H5 -4.503 2
H3 -2.992 9 H6 -4.539 4

残差序列平稳时对应变量间的回归方程为:

G=22.901 5+1.343 4H4T1=4.556 2T2=16.479 9R2=0.819 0R¯2=0.816 0Ftest=271.590 2D=1.409 9 (4)
G=-0.679 3+1.606 5H5T1=-0.142 8T2=22.294 3R2=0.892 3R¯2=0.890 5Ftest=497.033 7D=0.988 3 (5)
G=13.098 2+1.380 1H6T1=2.791 8T2=19.718 5R2=0.866 3R¯2=0.864 1Ftest=388.819 8D=1.035 9 (6)

式中:T1T2为相应参数的t检验值;R2为可决系数;R¯2为调整后的可决系数;Ftest为模型F检验值;D为杜宾沃森统计量。若F检验值和t检验值表现显著,则方程回归效果较好。

H1H6G分别构建最小二乘回归模型,协整检验结果显示,H1H3G的残差序列平稳性检验中检验值大于检验阈值,而H4H6G的残差序列平稳性检验中检验值小于检验阈值,说明只有H4H6G存在协整关系,可继续完成后续的Granger检验,检验阈值参考麦金农协整检验临界

32。为进一步明确H4H6G间的动态关系,需建立H4H6G间的误差修正模型:

ΔG=0.704 0ΔH4-0.570 0et-1T1=4.151 1T2=-4.849 4R2=0.356 7R¯2=0.322 8D=2.137 3 (7)

式中:ΔGΔH4分别为GH4的一阶差分;et-1=G(t-1)-20.073 5-1.392 0H4(t-1),其中G(t-1)G的滞后1期序列,H4(t-1)H4的滞后1期序列。

ΔG=1.230 2ΔH5-0.445 7et-1T1=10.097 8T2=-4.153 4R2=0.664 5R¯2=0.646 9D=2.042 4 (8)

式中:ΔH5H5的一阶差分;et-1=G(t-1)+2.264 4-1.635 6H5(t-1),其中H5(t-1)H5的滞后1期序列。

ΔG=1.101 9ΔH6-0.440 9et-1T1=7.362 7T2=-3.639 9R2=0.514 4R¯2=0.488 8D=2.119 0 (9)

式中:ΔH6H6的一阶差分;et-1=G(t-1)-17.019 7-1.322 5H6(t-1),其中H6(t-1)H6的滞后1期序列。

H4H6在短期内波动(增加)1%时,H4H6将在原基础上分别增加0.704 0%、1.230 2%和1.101 9%。从误差修正项的系数来看,当H4H6G短期波动偏离二者间的长期均衡关系时,将分别以-0.570 0、-0.445 7、-0.440 9的调整力度将H4H6G间的非均衡状态修正至均衡状态。

分析H4H6G间的协整关系及误差修正模型发现,H4H6G的3个误差修正模型中的误差修正项系数均符合反向调整机制。基于上述分析进一步厘清了存在协整关系的H4H6G之间长期稳定的特征以及在短期波动上的动态关系。在H4H6G之间均存在协整关系的基础上,进一步通过Granger检验分析它们之间影响的因果联系,表2为边缘侧Granger检验结果。由表2可见,在5%的临界水平下,假设“H4不是G的Granger原因”的显著性水平小于0.05,说明拒绝了原假设,所以H4是引起G变化的原因,可将H4视为台区中具有窃电嫌疑的用户。经现场稽查确证用户4存在私接线路窃电。

表2  边缘侧Granger检验结果
Table 2  Granger test results at edge side
假设显著性水平
G不是H4的Granger原因 0.013 7
H4不是G的Granger原因 0.046 5
G不是H5的Granger原因 0.506 8
H5不是G的Granger原因 0.423 2
G不是H6的Granger原因 0.027 5
H6不是G的Granger原因 0.729 1

3.2 主站检测对比实验

低压用户通信失败后推迟上报数据,此时主站端数据将失真地表现为台区高损或负损,误导窃电检测结果。为验证本文所提方法的优势,挑选该台区的任一工商业用户在某一天如第31天(2020年1月29日)报送电量数据失败,并在次日补报。此时,线损电量和线损率在当天会因为少报电量而增大,而在次日又会因为一次报送异常用户2天的电量而明显减少。用户H1H6电量缺失后的用电量与线损电量结果见附录A表A2。继续采用Granger因果检测法基于失真数据检验各用户与变化后的线损电量是否存在相关性。主站侧的Granger检验总结果如表3所示,用户H1H6的电量缺失时的各部分检验结果见附录A表A3至表A5。由表3和表A3至表A5可得出以下结论。

表3  主站侧Granger检验结果
Table 3  Granger test results in main station
类型缺失用户平稳性(线损电量、用电量)协整关系(线损电量与用电量)显著性检测结果稽查结果
边缘侧结果 一阶差分平稳 H4H5H6 H4 正确
主站侧结果 用户1 一阶差分平稳 H2H3H4H5H6 H2H3H4H5H6 误判
用户2 一阶差分平稳 H1H3H4H5H6 H1H3H4H5H6 误判
用户3 一阶差分平稳 H1H2H4H5H6 H1H2H4H5H6 误判
用户4 一阶差分平稳 H1H2H3H5H6 H1H2H3H5H6 误判
用户5 一阶差分平稳 H1H2H3H4H6 H1H2H3H4H6 误判
用户6 一阶差分平稳 H1H2H3H4H5 H1H2H3H4H5 误判

1)用户报送数据失败时,异常用户用电量与台区线损电量间不存在协整关系,无法继续使用Granger因果检验;其余用户用电量与线损电量仍存在协整关系,可继续使用Granger因果检验。

2)除报送数据异常用户外,其余用户均可被认定为窃电嫌疑用户。因用户4是稽查确认的窃电用户,低压用户报送电量失败再补报时,根据主站数据检测窃电用户的误报率上升到80%。

缺失数据填补是目前国内外研究的热点问题。文献[

18]提出了一种基于低秩矩阵理论的电能质量缺失数据填补方法。该方法设计多范数联合的低秩优化模型,并采用ADMM求解模型。文献[19]提出一种基于张量的多用户缺失电力数据的补全方法,在配电网低压台区缺失数据补全中采用了低秩张量补全模型。该方法通过对低压台区数据的特征进行分析,构建了该台区的标准缺失张量。然后在考虑用户数据自身特性和多用户数据多维内在相关性的基础上,利用补全张量的低秩性来建立模型,采用ADMM迭代求解。

采用主站侧逐个用户数据传输失真时的算例数据,对通信异常未报送电量的用户数据按矩阵填充和张量补全2种方式填补缺失的用户电量。出现数据传输异常用户在2020-01-29和2020-01-30的实际电量和2种方式填补后的电量如表4所示。2020-01-29和2020-01-30的实际线损电量分别为115.30 kW·h和118.13 kW·h。根据填补校正的用户电量,可以计算校正后的线损电量及对应误差百分比,计算结果如表5所示。

表4  填补电量缺失后的日用电量
Table 4  Daily electricity consumption after recovery of missing power data
填补方法日期日用电量/(kW·h)
H1H2H3H4H5H6
实际值 2020-01-29 95.04 90.63 77.66 77.70 80.25 85.80
2020-01-30 79.11 81.41 67.91 62.36 80.07 83.40
矩阵填补 2020-01-29 102.52 102.37 95.85 97.57 96.22 98.56
2020-01-30 97.45 95.63 90.46 90.75 92.81 91.38
张量补全 2020-01-29 107.39 108.31 79.33 79.14 85.41 86.79
2020-01-30 89.22 95.16 82.31 71.01 83.93 90.97
表5  填补电量缺失后的损失电量
Table 5  Loss power after recovery of missing power data
填补方法日期损失电量/(kW·h)误差/%
H1H2H3H4H5H6H1H2H3H4H5H6
矩阵填补 2020-01-29 104.37 103.15 100.64 97.12 99.27 106.31 -9.48 -10.54 -12.71 -15.77 -13.90 -7.80
2020-01-30 98.20 96.95 94.17 90.79 93.03 98.49 -16.87 -17.93 -20.28 -23.14 -21.25 -16.63
张量补全 2020-01-29 102.65 106.38 105.85 102.97 103.47 107.23 -10.97 -7.74 -8.20 -10.69 -10.26 -7.00
2020-01-30 113.28 114.14 112.35 111.03 111.17 112.73 -4.11 -3.38 -4.89 -6.01 -5.89 -4.57

表4表5可见,尽管现有研究一般认为矩阵填补和张量填补能较好地填补缺失数据,但这种有效性是建立在数据具有低秩性的前提下的,当台区中用户数据相互间不具有较强的关联性时,也并不一定能准确恢复缺失数据。采用填补后的数据测试Granger因果检测法能否准确识别窃电用户。2种方法填补后的Granger检验结果如表6所示,矩阵填补后用户H1H6的电量数据的各部分检验结果见附录A表A6至表A8。对比表4表6和表A6至表A8可得以下结论。

表6  主站数据填补后的Granger检验结果
Table 6  Results of Granger test after data recovery in main station
类型填补用户

平稳性

(线损电量与用电量)

协整关系

(线损电量与用电量)

显著性

检测结果

稽查结果
边缘结果 数据完整,无须填补 一阶差分平稳 H4H5H6 H4 正确
矩阵填充 用户1 一阶差分平稳 H1H2H4H5H6 失效
用户2 一阶差分平稳 H1H2H4H5H6 失效
用户3 一阶差分平稳 H1H2H3H4H5H6 失效
用户4 一阶差分平稳 H1H2H4H5H6 H4 正确
用户5 一阶差分平稳 H1H2H4H5H6 H5 误判
用户6 一阶差分平稳 H1H2H4H5H6 失效
张量补全 用户1 一阶差分平稳 H1H2H4H5H6 失效
用户2 一阶差分平稳 H2H4H5H6 H4 正确
用户3 一阶差分平稳 H2H4H5H6 失效
用户4 一阶差分平稳 H2H4H5H6 H4 正确
用户5 一阶差分平稳 H2H4H5H6 H4 正确
用户6 一阶差分平稳 H1H2H4H5H6 H6 误判

1)由矩阵填补后的数据分析可知,用户H1H3H6通信异常并填补恢复时,Granger分析无法判断哪个用户的窃电嫌疑最大;用户H4通信异常并填补恢复后,会将用户H4判断为窃电嫌疑最大的用户,检测正确;用户H5通信异常并填补恢复后,会将用户H5误判为窃电嫌疑最大的用户,根据矩阵填补的主站数据检测窃电用户的正确率显著下降到16.6%。

2)由张量补全后的数据分析可知,用户H1H3通信异常并填补恢复后,Granger分析方法无法判断哪个用户的窃电嫌疑最大;用户H2H4H5通信异常并填补恢复后,会将用户H4判断为窃电嫌疑最大的用户,检测正确;用户H6通信异常并填补恢复后,会将用户H6误判为窃电嫌疑最大的用户,根据张量补全的主站数据来检测窃电用户的正确率下降至50%。

3)矩阵填补和张量填补的目标是得到范数最小的低秩矩阵/张量,为得到低秩的补全数据,使得补全后的数据在一定误差范围内具有更高的线性相关性,在一定程度上改变用户与线损电量的相关性。从表4表5可知,2种补偿算法均有误差。由文献[

10]中Granger检验关系式可知,同一时间点被检测用户用电量和线损电量的一一对应关系对最终检验结果影响很大,而补全算法在一定误差范围内改变了此种相关关系,从而导致Granger检验无法准确识别窃电用户。

综上,采用相同方法进行窃电检测,不管是矩阵填充还是张量填充恢复失真数据,都会造成准确率明显下降。本文所提方法只需要将计算模式切换到边缘侧执行,即可消除数据失真引起误报的问题,显著降低误报率,提高低压用户窃电检测的准确性。

3.3 工程验证

某供电企业营销服务中心采用本文所提出的基于边缘计算的低压用户窃电检测方法进行验证。该地区线损率在5%以上的高损台区共计2 130个,其中配置有智能融合终端、可执行边缘计算的台区为124个,配置的智能融合终端如图5所示。

图5  典型台区的智能融合终端

Fig.5  Intelligent fusion terminal in typical distribution area

采用本文所提方法进行边缘侧窃电检测。从配变融合终端上抽取50个实际高损台区在边缘侧汇聚的2021年8月至11月间台区和用户计量数据进行窃电检测。

由于Granger归因分析有数据序列同阶的要求,有18个台区无法检测。在满足同阶要求的32个台区中,检出38个疑似窃电用户,其中7个台区未检出异常用户。对38个用户下发窃电检测工单,经现场查实窃电用户有29户,准确率为76%。其中,存在一个窃电用户的台区有11个,存在2个窃电用户的台区有9个,不存在3个及以上窃电用户的台区。

对于查实有异常用户的20个台区,根据主站侧计量数据采用效果较好的张量补全缺失数据后,再用Granger归因分析进行窃电检测。其中,6个台区能准确检出查实的窃电用户而无误判,共检出7个窃电用户;4个台区既检出窃电用户,又存在误判用户,共检出4个窃电用户;5个台区检出的用户均为误判用户;5个台区既没有检出也没有误判窃电用户。准确检出率为37.9%,明显低于采用边缘侧准确数据的识别准确率。

4 结语

针对用电信息采集系统主站低压计量数据失真影响窃电检测的问题,提出了基于边缘计算的低压用户窃电检测方法,主要结论如下。

1)分析指出低压用户通信异常导致主站计量数据失真,采用失真的计量数据进行高损台区窃电检测易造成误报,是阻碍低压用户窃电检测的重要因素。

2)针对难以根据失真的低压台区数据准确检测高损台区窃电用户的问题,提出以边缘计算方式在ITDS上进行窃电检测的新模式,因为采用本地数据,可以釜底抽薪地消除低压用户通信异常导致主站数据失真对窃电检测的干扰和影响。

3)基于高损台区实际数据,产生了通信异常数据、矩阵填补和张量填补失真数据。

4)基于以上4种模式下的数据应用Granger归因分析进行用电异常检测。测试结果表明,主站数据失真可导致线损归因分析方法将所有用户均判别为异常,导致窃电检测完全失效。采用矩阵填充失真数据时,检测准确率降低到16%;采用张量补全失真数据时,检测准确率降低到50%;而采用本文所提边缘计算方式进行窃电检测,不受通信异常影响,可准确检出窃电用户。

本文仅以Granger归因分析方法为例,验证所提方法的有效性,其他时间序列分析方法也可用于识别对线损异常有贡献的异常用户,但数据失真对检测效果的影响也是相似的。此外,因为零电量低压用户可用信息不足,本文所提方法不能用于检测零电量窃电用户。如何突破信息缺失的影响,是后续窃电检测的重点研究方向。

附录

附录A

表A1  高损台区异常检测算例序列平稳性检验结果
Table A1  Results of stationary test for high-loss distribution area anomaly detection cases
指标ADF检验值5%临界值平稳指标ADF检验值5%临界值平稳
G -1.7940 0.3801 ΔG -8.9978 0.0000
H1 -2.4498 0.1328 ΔH1 -9.7337 0.0000
H2 -0.4467 0.5171 ΔH2 -10.7129 0.0000
H3 -1.9382 0.3130 ΔH3 -7.9962 0.0000
H4 -0.4595 0.5121 ΔH4 -8.0350 0.0000
H5 -1.8255 0.3650 ΔH5 -9.3035 0.0000
H6 -0.4429 0.5187 ΔH6 -9.7269 0.0000

注:  (1)ADF检验的滞后期根据SIC准则自动选择

表A2  电量缺失用户的日用电量及台区日线损电量和线损率
Table A2  Daily electricity consumption and daily line loss of missing user
变化项目日期用户1用户2用户3用户4用户5用户6
日用电量 2020/1/29 0.00 0.00 0.00 0.00 0.00 0.00
2020/1/30 174.15 172.04 145.58 140.06 160.32 169.20
损失电量 2020/1/29 210.34 205.93 192.97 193.00 195.55 201.10
2020/1/30 23.09 27.50 40.46 40.43 37.88 32.33
线损率 2020/1/29 14.92 14.61 13.69 13.69 13.87 14.26
2020/1/30 1.74 2.08 3.06 3.05 2.86 2.44
表A3  高损台区异常检测算例电量缺失时的序列平稳性检验结果
Table A3  Results of stationary test for high-loss distribution area anomaly detection examples when data is missing
缺失用户指标ADF检验值5%临界值平稳缺失用户指标ADF检验值5%临界值平稳
用户1 G -0.4255 0.5254 用户1 G -9.7425 0.0000
H1 -2.1111 0.2412 H1 -11.0050 0.0000
用户2 G -2.5788 0.1030 用户2 G -9.6176 0.0000
H2 -0.3628 0.5497 H1 -8.6090 0.0000
用户3 G -2.3284 0.1666 用户3 G -9.1915 0.0000
H3 -0.1812 0.6166 H1 -9.0054 0.0000
用户4 G -2.3290 0.1665 用户4 G -9.1926 0.0000
H4 -1.9072 0.3269 H1 -10.1359 0.0000
用户5 G -2.3777 0.1522 用户5 G -9.2839 0.0000
H5 -2.0837 0.2519 H1 -8.3436 0.0000
用户6 G -2.4848 0.1242 用户6 G -9.4696 0.0000
H6 -0.4929 0.4983 H1 -9.0438 0.0000

注:  (1)ADF检验的滞后期根据SIC准则自动选择

表A4  高损台区电量缺失时的残差序列平稳性检验结果
Table A4  Residual sequence smoothness test results of high-loss distribution area when data is missing
缺失用户用户与线损电量的协整关系
H1H2H3H4H5H6
用户1 -2.6709 -9.5170 -9.2073 -11.1023 -11.1435 -11.5476
用户2 -8.6810 -2.9369 -8.9665 -10.9049 -10.9851 -11.3743
用户3 -8.0148 -8.4648 -2.1763 -10.2207 -10.4264 -10.7591
用户4 -8.0164 -8.4668 -8.1686 -3.2230 -10.4279 -10.7607
用户5 -8.1527 -8.6359 -8.3372 -10.370 -2.76783 -10.8954
用户6 -8.4407 -8.9863 -8.6849 -10.6688 -10.7943 -2.9051
表A5  高损台区电量缺失时各用户格兰杰检验结果
Table A5  Granger test results of user when electric quantity is missing in high-loss distribution area
缺失用户假设显著性水平缺失用户假设显著性水平
用户1 G不是H2的Granger原因 0.9039 用户2 G不是H1的格兰杰原因 0.7619
H2不是G的Granger原因 0.0007 H1不是G的格兰杰原因 0.0015
G不是H3的Granger原因 0.8367 G不是H3的格兰杰原因 0.8086
H3不是G的Granger原因 0.0025 H3不是G的格兰杰原因 0.0035
G不是H4的Granger原因 0.6699 G不是H4的格兰杰原因 0.7051
H4不是G的Granger原因 2.0E-07 H4不是G的格兰杰原因 4.0E-07
G不是H5的Granger原因 0.7404 G不是H5的格兰杰原因 0.7315
H5不是G的Granger原因 1.0E-05 H5不是G的格兰杰原因 2.0E-05
G不是 H6的Granger原因 0.3033 G不是H6的格兰杰原因 0.2789
H6不是G的Granger原因 2.0E-06 H6不是G的格兰杰原因 3.0E-06
用户3 G不是H1的格兰杰原因 0.6966 用户4 G不是H1的格兰杰原因 0.6968
H1不是G的格兰杰原因 0.0036 H1不是G的格兰杰原因 0.0035
G不是H2的格兰杰原因 0.8855 G不是H2的格兰杰原因 0.8856
H2不是G的格兰杰原因 0.0032 H2不是G的格兰杰原因 0.0032
G不是H4的格兰杰原因 0.8130 G不是H3的格兰杰原因 0.7112
H4不是G的格兰杰原因 2.0E-06 H3不是G的格兰杰原因 0.0097
G不是H5的格兰杰原因 0.7013 G不是H5的格兰杰原因 0.7014
H5不是G的格兰杰原因 6.0E-05 H5不是G的格兰杰原因 6.0E-05
G不是H6的格兰杰原因 0.2092 G不是H6的格兰杰原因 0.2093
H6不是G的格兰杰原因 2.0E-05 H6不是G的格兰杰原因 2.00E-05
用户5 G不是H1的格兰杰原因 0.7125 用户6 G不是H1的格兰杰原因 0.7416
H1不是G的格兰杰原因 0.0030 H1不是G的格兰杰原因 0.0020
G不是H2的格兰杰原因 0.8892 G不是H2的格兰杰原因 0.8959
H2不是G的格兰杰原因 0.0025 H2不是G的格兰杰原因 0.0015
G不是H3的格兰杰原因 0.7320 G不是H3的格兰杰原因 0.7747
H3不是G的格兰杰原因 0.0079 H3不是G的格兰杰原因 0.0051
G不是H4的格兰杰原因 0.7916 G不是H4的格兰杰原因 0.7450
H4不是G的格兰杰原因 1.0E-06 H4不是G的格兰杰原因 6.0E-07
G不是H6的格兰杰原因 0.2226 G不是H5的格兰杰原因 0.7210
H6不是G的格兰杰原因 1.0E-05 H5不是G的格兰杰原因 3.0E-05
表A6  高损台区异常检测算例电量矩阵填补后的序列平稳性检验结果
Table A6  Results of sequence stationarity test after electric charge filling for abnormal detection of high-loss distribution area
填补用户指标ADF检验值5%临界值平稳填补用户指标ADF检验值5%临界值平稳
用户1 G -1.9633 0.3020 用户1 G -8.3051 0.0000
H1 -2.3450 0.1616 H1 -9.6486 0.0000
用户2 G -1.9826 0.2936 用户2 G -8.2684 0.0000
H2 -0.4545 0.5140 H1 -10.5217 0.0000
用户3 G -2.0259 0.2753 用户3 G -8.1921 0.0000
H3 -1.9701 0.2990 H1 -7.7664 0.0000
用户4 G -2.0855 0.2511 用户4 G -8.1028 0.0000
H4 -1.6671 0.4427 H1 -7.2816 0.0000
用户5 G -2.0471 0.2665 用户5 G -8.1595 0.0000
H5 -1.8255 0.3650 H1 -9.2674 0.0000
用户6 G -1.9471 0.3091 用户6 G -8.3321 0.0000
H6 -0.4395 0.5201 H1 -9.0423 0.0000

注:  (1)ADF检验的滞后期根据SIC准则自动选择

表A7  高损台区电量矩阵填补后的残差序列平稳性检验结果
Table A7  Stationarity test results of residual series after electric quantity filling in high-loss distribution area
填补用户用户与线损电量的协整关系
H1H2H3H4H5H6
用户1 -5.214164 -3.482698 -3.09978 -5.449345 -4.374413 -4.191028
用户2 -5.234274 -3.643021 -3.124115 -5.385414 -4.370222 -4.172346
用户3 -5.258127 -3.533207 -3.516113 -5.385414 -4.365169 -4.140153
用户4 -5.288133 -3.580154 -3.249666 -4.759314 -4.68426 -4.104033
用户5 -5.270299 -3.54966 -3.203943 -5.366724 -5.08934 -4.123953
用户6 -5.20336 -3.473949 -3.071345 -5.456658 -4.393573 -4.006502
表A8  高损台区电量数据矩阵填补后的各用户格兰杰检验结果
Table A8  Granger test results of each user after filling the electric quantity data of high-loss distribution area
填补用户假设显著性水平填补用户假设显著性水平
用户1 G不是H1的Granger原因 0.0033 用户2 G不是H1的格兰杰原因 0.0011
H1不是G的Granger原因 0.0845 H1不是G的格兰杰原因 0.1784
G不是H2的Granger原因 0.4631 G不是H2的格兰杰原因 0.2636
H2不是G的Granger原因 0.1989 H2不是G的格兰杰原因 0.1106
G不是 H4的Granger原因 0.0152 G不是H4的格兰杰原因 0.0150
H4不是G的Granger原因 0.0882 H4不是G的格兰杰原因 0.0878
G不是H5的Granger原因 0.5625 G不是H5的格兰杰原因 0.5713
H5不是G的Granger原因 0.1428 H5不是G的格兰杰原因 0.1286
G不是 H6的Granger原因 0.0408 G不是H6的格兰杰原因 0.0426
H6不是G的Granger原因 0.9447 H6不是G的格兰杰原因 0.9431
用户3 G不是H1的格兰杰原因 0.0013 用户4 G不是H1的格兰杰原因 0.0015
H1不是G的格兰杰原因 0.1751 H1不是G的格兰杰原因 0.1656
G不是H2的格兰杰原因 0.4267 G不是H2的格兰杰原因 0.3981
H2不是G的格兰杰原因 0.1686 H2不是G的格兰杰原因 0.1460
G不是H3的格兰杰原因 0.0111 G不是H4的格兰杰原因 0.0075
H3不是G的格兰杰原因 0.8125 H4不是G的格兰杰原因 0.0340
G不是H4的格兰杰原因 0.0149 G不是H5的格兰杰原因 0.6137
H4不是G的格兰杰原因 0.0849 H5不是G的格兰杰原因 0.0769
G不是H5的格兰杰原因 0.5894 G不是H6的格兰杰原因 0.0527
H5不是G的格兰杰原因 0.1028 H6不是G的格兰杰原因 0.8697
G不是H6的格兰杰原因 0.0467
H6不是G的格兰杰原因 0.9220
用户5 G不是H1的格兰杰原因 0.0014 用户6 G不是H1的格兰杰原因 0.0012
H1不是G的格兰杰原因 0.1720 H1不是G的格兰杰原因 0.1807
G不是H2的格兰杰原因 0.4160 G不是H2的格兰杰原因 0.4728
H2不是G的格兰杰原因 0.1596 H2不是G的格兰杰原因 0.2127
G不是H4的格兰杰原因 0.0145 G不是H4的格兰杰原因 0.0175
H4不是G的格兰杰原因 0.0827 H4不是G的格兰杰原因 0.0882
G不是H5的格兰杰原因 0.1408 G不是H5的格兰杰原因 0.5491
H5不是G的格兰杰原因 0.0461 H5不是G的格兰杰原因 0.1582
G不是H6的格兰杰原因 0.0488 G不是H6的格兰杰原因 0.0140
H6不是G的格兰杰原因 0.8775 H6不是G的格兰杰原因 0.8775

参考文献

1

BISWAS P PCAI H YZHOU Bet al. Electricity theft pinpointing through correlation analysis of master and individual meter readings[J]. IEEE Transactions on Smart Grid2020114): 3031-3042. [百度学术] 

2

张承智肖先勇郑子萱.基于实值深度置信网络的用户侧窃电行为检测[J].电网技术2019433):1083-1091 [百度学术] 

ZHANG ChengzhiXIAO XianyongZHENG Zixuan. User-side power-stealing behavior detection based on real-valued deep confidence network[J]. Power System Technology2019433): 1083-1091. [百度学术] 

3

WANG YCHEN Q XHONG Tet al. Review of smart meter data analytics: applications, methodologies, and challenges[J]. IEEE Transactions on Smart Grid2019103): 3125-3148. [百度学术] 

4

李滨严康罗发.最优标杆在市级电网企业线损精益管理中的综合应用[J].电力系统自动化20184223):184-191. [百度学术] 

LI BinYAN KangLUO Faet al. Comprehensive application of optimal benchmarking in line loss lean management of city-level power grid enterprises[J]. Automation of Electric Power Systems20184223): 184-191. [百度学术] 

5

ZHENG K DCHEN Q XWANG Yet al. A novel combined data-driven approach for electricity theft detection[J]. IEEE Transactions on Industrial Informatics2019153): 1809-1819. [百度学术] 

6

庄池杰张斌胡军.基于无监督学习的电力用户异常用电模式检测[J].中国电机工程学报2016362):379-387. [百度学术] 

ZHUANG ChijieZHANG BinHU Junet al. Anomaly detection for power consumption patterns based on unsupervised learning[J]. Proceedings of the CSEE2016362): 379-387. [百度学术] 

7

孙毅李世豪崔灿.基于高斯核函数改进的电力用户用电数据离群点检测方法[J].电网技术2018425):1595-1606. [百度学术] 

SUN YiLI ShihaoCUI Canet al. Improved outlier detection method of power consumer data based on Gaussian kernel function[J]. Power System Technology2018425): 1595-1606. [百度学术] 

8

胡天宇郭庆来孙宏斌.基于堆叠去相关自编码器和支持向量机的窃电检测[J].电力系统自动化2019431):119-125. [百度学术] 

HU TianyuGUO QinglaiSUN Hongbin. Nontechnical loss detection based on stacked uncorrelating autoencoder and support vector machine[J]. Automation of Electric Power Systems2019431): 119-125. [百度学术] 

9

金晟苏盛薛阳.数据驱动窃电检测方法综述与低误报率研究展望[J].电力系统自动化2022461):3-14. [百度学术] 

JIN ShengSU ShengXUE Yanget al. Review on data-driven based electricity theft detection method and research prospect for low false positive rate[J]. Automation of Electric Power Systems2022461): 3-14. [百度学术] 

10

金晟苏盛曹一家.基于格兰杰归因分析的高损台区窃电检测[J].电力系统自动化20204423):82-89. [百度学术] 

JIN ShengSU ShengCAO Yijiaet al. Electricity-theft detection for high-loss distribution area based on granger causality analysis[J]. Automation of Electric Power Systems20204423): 82-89. [百度学术] 

11

唐冬来刘友波熊智临.基于时空关联矩阵的配电台区反窃电预警方法[J].电力系统自动化20204419):168-176. [百度学术] 

TANG DonglaiLIU YouboXIONG Zhilinet al. Early warning method of electricity anti-theft in distribution station area based on spatiotemporal correlation matrix[J]. Automation of Electric Power Systems20204419): 168-176. [百度学术] 

12

杨玉莲齐林海王红.基于生成对抗和双重语义感知的配电网量测数据缺失重构[J].电力系统自动化20204418):46-54. [百度学术] 

YANG YulianQI LinhaiWANG Honget al. Reconstruction of missing measurement data in distribution network based on generative adversarial network and double semantic perception[J]. Automation of Electric Power Systems20204418): 46-54. [百度学术] 

13

SUNDARARAJAN AKHAN TMOGHADASI Aet al. Survey on synchrophasor data quality and cybersecurity challenges, and evaluation of their interdependencies[J]. Journal of Modern Power Systems and Clean Energy201973): 449-467. [百度学术] 

14

CHEN X YMCELROY M BWU Q Wet al. Transition towards higher penetration of renewables: an overview of interlinked technical, environmental and socio-economic challenges[J]. Journal of Modern Power Systems and Clean Energy201971): 1-8. [百度学术] 

15

杨挺赵黎媛王成山.人工智能在电力系统及综合能源系统中的应用综述[J].电力系统自动化2019431):2-14. [百度学术] 

YANG TingZHAO LiyuanWANG Chengshan. Review on application of artificial intelligence in power system and integrated energy system[J]. Automation of Electric Power Systems2019431): 2-14. [百度学术] 

16

DADANEH S ZDOUGHERTY E RQIAN X N. Optimal Bayesian classification with missing values[J]. IEEE Transactions on Signal Processing20186616): 4182-4192. [百度学术] 

17

SONG X XGUO YLI Net al. A novel approach for missing data prediction in coevolving time series[J]. Computing201910111): 1565-1584. [百度学术] 

18

杨挺李扬何周泽.基于矩阵填充的泛在电力物联网电能质量数据修复算法[J].电力系统自动化2020442):13-21. [百度学术] 

YANG TingLI YangHE Zhouzeet al. Matrix completion theory based recovery algorithm for power quality data in ubiquitous power Internet of Things[J]. Automation of Electric Power Systems2020442): 13-21. [百度学术] 

19

赵洪山寿佩瑶马利波.低压台区缺失数据的张量补全方法[J].中国电机工程学报20204022):7328-7337. [百度学术] 

ZHAO HongshanSHOU PeiyaoMA Libo. A tensor completion method of missing data in transformer district[J]. Proceedings of the CSEE20204022): 7328-7337. [百度学术] 

20

王守相陈海文潘志新.采用改进生成式对抗网络的电力系统量测缺失数据重建方法[J].中国电机工程学报2019391):56-64. [百度学术] 

WANG ShouxiangCHEN HaiwenPAN Zhixinet al. A reconstruction method for missing data in power system measurement using an improved generative adversarial network[J]. Proceedings of the CSEE2019391): 56-64. [百度学术] 

21

刘东奇曾祥君王耀南.基于信息熵的智能配电变压器终端安全态势评估[J].南方电网技术2020141):18-23. [百度学术] 

LIU DongqiZENG XiangjunWANG Yaonan. Security situation assessment of intelligent distribution transformer terminal unit based on information entropy[J]. Southern Power System Technology2020141): 18-23. [百度学术] 

22

黄彦钦余浩尹钧毅.电力物联网数据传输方案:现状与基于5G技术的展望[J].电工技术学报20213617):3581-3593. [百度学术] 

HUANG YanqinYU HaoYIN Junyiet al. Data transmission schemes of power Internet of Things: present and outlook based on 5G technology[J]. Transactions of China Electrotechnical Society20213617): 3581-3593. [百度学术] 

23

钟加勇熊小伏何迎春.面向台区智能终端的即插即用和拓扑识别方法[J].电力系统自动化20214510):166-173. [百度学术] 

ZHONG JiayongXIONG XiaofuHE Yingchunet al. Plug-play and topology identification method for intelligent terminal in distribution station area[J]. Automation of Electric Power Systems20214510): 166-173. [百度学术] 

24

田世明龚桃荣黄小庆.基于电力大数据的地区E-GDP值预测[J].电力自动化设备20193911):198-204. [百度学术] 

TIAN ShimingGONG TaorongHUANG Xiaoqinget al. Forecasting regional E-GDP value using power big data[J]. Electric Power Automation Equipment20193911): 198-204. [百度学术] 

25

范海东王玥李清毅.基于稀疏故障演化判别分析的故障根源追溯[J].控制工程2019267):1239-1244. [百度学术] 

FAN HaidongWANG YueLI Qingyiet al. Sparse fault degradation oriented fisher discriminant analysis based fault trace[J]. Control Engineering of China2019267): 1239-1244. [百度学术] 

26

ZHU J YSUN C XLI V O K. An extended spatio-temporal granger causality model for air quality estimation with heterogeneous urban big data[J]. IEEE Transactions on Big Data201733): 307-319. [百度学术] 

27

SHI W SCAO JZHANG Qet al. Edge computing: vision and challenges[J]. IEEE Internet of Things Journal201635): 637-646. [百度学术] 

28

李钦豪张勇军陈佳琦.泛在电力物联网发展形态与挑战[J].电力系统自动化2020441):13-22. [百度学术] 

LI QinhaoZHANG YongjunCHEN Jiaqiet al. Development patterns and challenges of ubiquitous power Internet of Things[J]. Automation of Electric Power Systems2020441): 13-22. [百度学术] 

29

王鹤李石强于华楠.基于分布式压缩感知和边缘计算的配电网电能质量数据压缩存储方法[J].电工技术学报20203521):4553-4564. [百度学术] 

WANG HeLI ShiqiangYU Huananet al. Compression acquisition method for power quality data of distribution network based on distributed compressed sensing and edge computing[J]. Transactions of China Electrotechnical Society20203521): 4553-4564. [百度学术] 

30

龚钢军罗安琴陈志敏.基于边缘计算的主动配电网信息物理系统[J].电网技术20184210):3128-3135. [百度学术] 

GONG GangjunLUO AnqinCHEN Zhiminet al. Cyber physical system of active distribution network based on edge computing[J]. Power System Technology20184210): 3128-3135. [百度学术] 

31

聂峥章坚民傅华渭.配变终端边缘节点化及容器化的关键技术和应用场景设计[J].电力系统自动化2020443):154-161. [百度学术] 

NIE ZhengZHANG JianminFU Huawei. Key technologies and application scenario design for making distribution transformer terminal unit being a containerized edge node[J]. Automation of Electric Power Systems2020443): 154-161. [百度学术] 

32

潘泽清.时间序列分析:宏观经济数据分析模型[M].北京经济科学出版社2017. [百度学术] 

PAN Zeqing. Time series analysis: model for macroeconomic data analysis[M]. BeijingEconomic Science Press2017. [百度学术]