摘要
低压用户窃电导致线损电量增加,对台区线损异动进行归因分析是识别窃电用户的有效途径。低压用户通信异常多发,可导致用电信息采集系统主站数据失真,易误导窃电检测。利用配变终端可就地完整准确采集台区数据的特点,提出基于边缘计算的低压用户窃电检测方法。首先,在通信正常和异常的条件下,分析台区窃电用户用电量与线损电量的关联关系;然后,在配变终端窃电检测模块中对真实的台区线损和用户用电量进行归因分析来识别窃电用户;最后,基于高损台区实际数据的仿真分析,验证了所提方法相比于在主站侧采用异常数据以及采用不同缺失数据填补算法修复后的数据进行窃电检测时的优势。
低压用户窃电是长期存在的痼疾,除直接导致供电企业利润流失外,窃电用户私拉乱接还是造成触电等人身伤亡事故的重要诱
智能电表的普及应用为开展数据驱动的窃电检测奠定了坚实基础。文献[
需要指出的是,台区低压用户通信异常多发,通信失败后常延迟几天后一次报送多日电量。根据主站数据统计台区线损电量时,用户数据报送失败当日会造成台区异常高损,而补报电量时又会造成台区低损甚至负损。现有窃电检测方法以数据完整准确为前提,采用失真数据进行窃电检测易导致错误结果,阻碍低压用户窃电检测工作的开展。
针对因台区数据缺失而无法进行准确窃电检测的问题,提出一种基于边缘计算的低压用户窃电检测方法。首先,比较分析了缺失数据的补全方法;然后,在通信正常和异常的条件下,分析台区窃电用户用电量与线损电量的关联关系,并利用台区智能终端(intelligent terminal of distribution substation,ITDS)可完整准确地就地采集用户数据的特点,提出基于边缘计算的低压用户窃电检测框架;最后,基于实际含窃电用户台区数据,验证了所提方法相比于在主站侧采用异常数据以及采用不同缺失数据填补算法修复后的数据进行窃电检测时的优势。
由于量测数据在测量与采集、传输与转换等各个环节均有可能受到干扰甚至发生故障,因此数据缺失错漏是电力系统长期存在的问题。传统上,对于电网冗余配置量测的状态量,可以在实现状态估计可观性的条件下采用伪量测的方式代替少数缺失数据。智能配用电系统中,用户用电数据同样存在数据缺失错漏的情况。此类数据难以用状态估计填
由于缺失数据填补在很多科学和工程领域都有广泛的应用,近年来科研人员围绕该问题开展了大量研究并取得了较大进
(1) |
(2) |
式中:表示矩阵核范数;K为恢复后的低秩矩阵;M为只观测到部分元素的待修复矩阵;为M中非空元素位置集合,若矩阵M的元素被观测到,则有;为算子。由于实际系统一般存在高斯噪声和尖峰等形式噪声,考虑含噪声的实际数据的数据恢复模型如
(3) |
式中:E为尖峰异常值矩阵;G为高斯噪声矩阵;ρ和δ为相应的权重系数;表示F范数;N为辅助矩阵。求出
建立在矩阵填补基础上的张量填补,实际上是一种高维矩阵填补。由于多个用户在不同日的用电数据可能具有潜在的多维内在相关性,采用张量填补可利用更宽维度上的信息提高缺失数据填补效果,并已在低压台区缺失数据上得到成功应
与矩阵填补和张量填补利用数据本身的低秩性恢复缺失数据不同,生成对抗网络(generative adversarial network,GAN)方法采用数据驱动的方式,通过GAN的对抗博弈对大量无标签数据进行特征提取训练,获得能够准确识别数据真假性的判别模型和捕获数据潜在特征与时空分布特性的生成模型。然后,采用双重语义感知约束重新训练模型,找到与含缺失值的待重构数据拥有最大相似性的备选数据,即可将其对应位置数据填补缺失部分数
配电台区非技术线损主要由窃电所致,非零电量窃电用户的窃电量与电表计量电量大多呈正相关,这会使得线损电量与窃电用户计量电量之间存在潜在的因果关联。因此,可用归因分析识别台区线损与接入用户计量电量的相关性,以识别嫌疑用户,提高窃电稽查的靶向性。
采用某实际高损台区数据分析用户电量与线损电量间的关联性。该高损台区62天的实际线损电量如

图1 高损台区接入用户用电量及线损电量
Fig.1 Electricity consumption of users and line loss power in high-loss distribution area
由
一般安装于配电房二次

图2 配电台区通信架构
Fig.2 Communication architecture of distribution area
实际系统中,用户通信失败延后1至2天上报数据的情况多发。为呈现通信异常对主站数据的影响,随机选取1.1节高损台区的任一工商业用户(如用户1)在某一天(如2020年1月29日)报送电量异常并在次日补报,实验结果如

图3 通信异常时用户用电量及线损电量
Fig.3 Electricity consumption and line loss power with communication anomaly
经济学中常用协整检验与Granger检验来分析时间序列间的相关性。一般先采用协整检验检测序列间是否存在长期的均衡关系,然后采用Granger检验判断一个变量能否对另一变量产生影
传统上,受现场终端计算资源约束,只能将业务功能集中部署于中心主站等核心节点,系统性能取决于通信网络和主站的性能水
ITDS是边缘计算技术在配用电系统应用的典范。它作为服务台区的综合平台,可以在边缘侧基于台区基础数据提供线损分析、电能质量监控、拓扑分析和户变关系分析等业务。因为不同业务功能模块可能由各厂家按存在差异的系统环境设计实现,需要采用容器技术支撑软、硬件解耦,从而在同一平台上实现不同厂家的业务系统功
结合2.1节的低压窃电用户与台区线损关联分析与2.2节的配用电物联网边缘计算架构,提出基于边缘计算的低压用户窃电检测方法。该方法的核心是利用的集中器就地获得台区用户计量数据,然后线损根据台区供电量和用户电量分析线损电量,最后在窃电检测中对台区线损和用户电量采用Granger归因分析或其他算法来识别窃电用户,并将检测结果上传至云端,实现流程如

图4 基于边缘计算的窃电检测框架
Fig.4 Electricity theft detection framework based on edge computing
首先根据1.1节中高损台区实际数据,采用Granger归因分析方法进行窃电检测测试分析,然后将主站侧失真数据和失真后经矩阵填补和张量填补的数据进行对比测试。
在边缘侧对G、H1至H6及其差分序列分别完成单位根(ADF)检验。以5%的置信度为标准,序列均为一阶单整序列,检验结果见附录A表A1。
分别对G、H1至H6采用Engle-Granger协整检验,再通过检验对残差序列完成平稳检测,残差序列平稳性检测结果如
残差序列平稳时对应变量间的回归方程为:
(4) |
(5) |
(6) |
式中:T1和T2为相应参数的t检验值;为可决系数;为调整后的可决系数;为模型F检验值;D为杜宾沃森统计量。若检验值和t检验值表现显著,则方程回归效果较好。
对H1至H6和G分别构建最小二乘回归模型,协整检验结果显示,H1至H3与G的残差序列平稳性检验中检验值大于检验阈值,而H4至H6与G的残差序列平稳性检验中检验值小于检验阈值,说明只有H4至H6与G存在协整关系,可继续完成后续的Granger检验,检验阈值参考麦金农协整检验临界
(7) |
式中:和分别为和的一阶差分;,其中为G的滞后1期序列,为的滞后1期序列。
(8) |
式中:为的一阶差分;,其中为的滞后1期序列。
(9) |
式中:为的一阶差分;,其中为的滞后1期序列。
当H4至H6在短期内波动(增加)1%时,H4至H6将在原基础上分别增加0.704 0%、1.230 2%和1.101 9%。从误差修正项的系数来看,当H4至H6与G短期波动偏离二者间的长期均衡关系时,将分别以-0.570 0、、-0.440 9的调整力度将H4至H6与G间的非均衡状态修正至均衡状态。
分析H4至H6与G间的协整关系及误差修正模型发现,H4至H6与G的3个误差修正模型中的误差修正项系数均符合反向调整机制。基于上述分析进一步厘清了存在协整关系的H4至H6与G之间长期稳定的特征以及在短期波动上的动态关系。在H4至H6与G之间均存在协整关系的基础上,进一步通过Granger检验分析它们之间影响的因果联系,
低压用户通信失败后推迟上报数据,此时主站端数据将失真地表现为台区高损或负损,误导窃电检测结果。为验证本文所提方法的优势,挑选该台区的任一工商业用户在某一天如第31天(2020年1月29日)报送电量数据失败,并在次日补报。此时,线损电量和线损率在当天会因为少报电量而增大,而在次日又会因为一次报送异常用户2天的电量而明显减少。用户H1至H6电量缺失后的用电量与线损电量结果见附录A表A2。继续采用Granger因果检测法基于失真数据检验各用户与变化后的线损电量是否存在相关性。主站侧的Granger检验总结果如
1)用户报送数据失败时,异常用户用电量与台区线损电量间不存在协整关系,无法继续使用Granger因果检验;其余用户用电量与线损电量仍存在协整关系,可继续使用Granger因果检验。
2)除报送数据异常用户外,其余用户均可被认定为窃电嫌疑用户。因用户4是稽查确认的窃电用户,低压用户报送电量失败再补报时,根据主站数据检测窃电用户的误报率上升到80%。
缺失数据填补是目前国内外研究的热点问题。文献[
采用主站侧逐个用户数据传输失真时的算例数据,对通信异常未报送电量的用户数据按矩阵填充和张量补全2种方式填补缺失的用户电量。出现数据传输异常用户在2020-01-29和2020-01-30的实际电量和2种方式填补后的电量如
由
1)由矩阵填补后的数据分析可知,用户H1至H3、H6通信异常并填补恢复时,Granger分析无法判断哪个用户的窃电嫌疑最大;用户H4通信异常并填补恢复后,会将用户H4判断为窃电嫌疑最大的用户,检测正确;用户H5通信异常并填补恢复后,会将用户H5误判为窃电嫌疑最大的用户,根据矩阵填补的主站数据检测窃电用户的正确率显著下降到16.6%。
2)由张量补全后的数据分析可知,用户H1、H3通信异常并填补恢复后,Granger分析方法无法判断哪个用户的窃电嫌疑最大;用户H2、H4、H5通信异常并填补恢复后,会将用户H4判断为窃电嫌疑最大的用户,检测正确;用户H6通信异常并填补恢复后,会将用户H6误判为窃电嫌疑最大的用户,根据张量补全的主站数据来检测窃电用户的正确率下降至50%。
3)矩阵填补和张量填补的目标是得到范数最小的低秩矩阵/张量,为得到低秩的补全数据,使得补全后的数据在一定误差范围内具有更高的线性相关性,在一定程度上改变用户与线损电量的相关性。从
综上,采用相同方法进行窃电检测,不管是矩阵填充还是张量填充恢复失真数据,都会造成准确率明显下降。本文所提方法只需要将计算模式切换到边缘侧执行,即可消除数据失真引起误报的问题,显著降低误报率,提高低压用户窃电检测的准确性。
某供电企业营销服务中心采用本文所提出的基于边缘计算的低压用户窃电检测方法进行验证。该地区线损率在5%以上的高损台区共计2 130个,其中配置有智能融合终端、可执行边缘计算的台区为124个,配置的智能融合终端如

图5 典型台区的智能融合终端
Fig.5 Intelligent fusion terminal in typical distribution area
采用本文所提方法进行边缘侧窃电检测。从配变融合终端上抽取50个实际高损台区在边缘侧汇聚的2021年8月至11月间台区和用户计量数据进行窃电检测。
由于Granger归因分析有数据序列同阶的要求,有18个台区无法检测。在满足同阶要求的32个台区中,检出38个疑似窃电用户,其中7个台区未检出异常用户。对38个用户下发窃电检测工单,经现场查实窃电用户有29户,准确率为76%。其中,存在一个窃电用户的台区有11个,存在2个窃电用户的台区有9个,不存在3个及以上窃电用户的台区。
对于查实有异常用户的20个台区,根据主站侧计量数据采用效果较好的张量补全缺失数据后,再用Granger归因分析进行窃电检测。其中,6个台区能准确检出查实的窃电用户而无误判,共检出7个窃电用户;4个台区既检出窃电用户,又存在误判用户,共检出4个窃电用户;5个台区检出的用户均为误判用户;5个台区既没有检出也没有误判窃电用户。准确检出率为37.9%,明显低于采用边缘侧准确数据的识别准确率。
针对用电信息采集系统主站低压计量数据失真影响窃电检测的问题,提出了基于边缘计算的低压用户窃电检测方法,主要结论如下。
1)分析指出低压用户通信异常导致主站计量数据失真,采用失真的计量数据进行高损台区窃电检测易造成误报,是阻碍低压用户窃电检测的重要因素。
2)针对难以根据失真的低压台区数据准确检测高损台区窃电用户的问题,提出以边缘计算方式在ITDS上进行窃电检测的新模式,因为采用本地数据,可以釜底抽薪地消除低压用户通信异常导致主站数据失真对窃电检测的干扰和影响。
3)基于高损台区实际数据,产生了通信异常数据、矩阵填补和张量填补失真数据。
4)基于以上4种模式下的数据应用Granger归因分析进行用电异常检测。测试结果表明,主站数据失真可导致线损归因分析方法将所有用户均判别为异常,导致窃电检测完全失效。采用矩阵填充失真数据时,检测准确率降低到16%;采用张量补全失真数据时,检测准确率降低到50%;而采用本文所提边缘计算方式进行窃电检测,不受通信异常影响,可准确检出窃电用户。
本文仅以Granger归因分析方法为例,验证所提方法的有效性,其他时间序列分析方法也可用于识别对线损异常有贡献的异常用户,但数据失真对检测效果的影响也是相似的。此外,因为零电量低压用户可用信息不足,本文所提方法不能用于检测零电量窃电用户。如何突破信息缺失的影响,是后续窃电检测的重点研究方向。
附录
注: (1)ADF检验的滞后期根据SIC准则自动选择
注: (1)ADF检验的滞后期根据SIC准则自动选择
注: (1)ADF检验的滞后期根据SIC准则自动选择
参考文献
BISWAS P P, CAI H Y, ZHOU B, et al. Electricity theft pinpointing through correlation analysis of master and individual meter readings[J]. IEEE Transactions on Smart Grid, 2020, 11(4): 3031-3042. [百度学术]
张承智,肖先勇,郑子萱.基于实值深度置信网络的用户侧窃电行为检测[J].电网技术,2019,43(3):1083-1091. [百度学术]
ZHANG Chengzhi, XIAO Xianyong, ZHENG Zixuan. User-side power-stealing behavior detection based on real-valued deep confidence network[J]. Power System Technology, 2019, 43(3): 1083-1091. [百度学术]
WANG Y, CHEN Q X, HONG T, et al. Review of smart meter data analytics: applications, methodologies, and challenges[J]. IEEE Transactions on Smart Grid, 2019, 10(3): 3125-3148. [百度学术]
李滨,严康,罗发,等.最优标杆在市级电网企业线损精益管理中的综合应用[J].电力系统自动化,2018,42(23):184-191. [百度学术]
LI Bin, YAN Kang, LUO Fa, et al. Comprehensive application of optimal benchmarking in line loss lean management of city-level power grid enterprises[J]. Automation of Electric Power Systems, 2018, 42(23): 184-191. [百度学术]
ZHENG K D, CHEN Q X, WANG Y, et al. A novel combined data-driven approach for electricity theft detection[J]. IEEE Transactions on Industrial Informatics, 2019, 15(3): 1809-1819. [百度学术]
庄池杰,张斌,胡军,等.基于无监督学习的电力用户异常用电模式检测[J].中国电机工程学报,2016,36(2):379-387. [百度学术]
ZHUANG Chijie, ZHANG Bin, HU Jun, et al. Anomaly detection for power consumption patterns based on unsupervised learning[J]. Proceedings of the CSEE, 2016, 36(2): 379-387. [百度学术]
孙毅,李世豪,崔灿,等.基于高斯核函数改进的电力用户用电数据离群点检测方法[J].电网技术,2018,42(5):1595-1606. [百度学术]
SUN Yi, LI Shihao, CUI Can, et al. Improved outlier detection method of power consumer data based on Gaussian kernel function[J]. Power System Technology, 2018, 42(5): 1595-1606. [百度学术]
胡天宇,郭庆来,孙宏斌.基于堆叠去相关自编码器和支持向量机的窃电检测[J].电力系统自动化,2019,43(1):119-125. [百度学术]
HU Tianyu, GUO Qinglai, SUN Hongbin. Nontechnical loss detection based on stacked uncorrelating autoencoder and support vector machine[J]. Automation of Electric Power Systems, 2019, 43(1): 119-125. [百度学术]
金晟,苏盛,薛阳,等.数据驱动窃电检测方法综述与低误报率研究展望[J].电力系统自动化,2022,46(1):3-14. [百度学术]
JIN Sheng, SU Sheng, XUE Yang, et al. Review on data-driven based electricity theft detection method and research prospect for low false positive rate[J]. Automation of Electric Power Systems, 2022, 46(1): 3-14. [百度学术]
金晟,苏盛,曹一家,等.基于格兰杰归因分析的高损台区窃电检测[J].电力系统自动化,2020,44(23):82-89. [百度学术]
JIN Sheng, SU Sheng, CAO Yijia, et al. Electricity-theft detection for high-loss distribution area based on granger causality analysis[J]. Automation of Electric Power Systems, 2020, 44(23): 82-89. [百度学术]
唐冬来,刘友波,熊智临,等.基于时空关联矩阵的配电台区反窃电预警方法[J].电力系统自动化,2020,44(19):168-176. [百度学术]
TANG Donglai, LIU Youbo, XIONG Zhilin, et al. Early warning method of electricity anti-theft in distribution station area based on spatiotemporal correlation matrix[J]. Automation of Electric Power Systems, 2020, 44(19): 168-176. [百度学术]
杨玉莲,齐林海,王红,等.基于生成对抗和双重语义感知的配电网量测数据缺失重构[J].电力系统自动化,2020,44(18):46-54. [百度学术]
YANG Yulian, QI Linhai, WANG Hong, et al. Reconstruction of missing measurement data in distribution network based on generative adversarial network and double semantic perception[J]. Automation of Electric Power Systems, 2020, 44(18): 46-54. [百度学术]
SUNDARARAJAN A, KHAN T, MOGHADASI A, et al. Survey on synchrophasor data quality and cybersecurity challenges, and evaluation of their interdependencies[J]. Journal of Modern Power Systems and Clean Energy, 2019, 7(3): 449-467. [百度学术]
CHEN X Y, MCELROY M B, WU Q W, et al. Transition towards higher penetration of renewables: an overview of interlinked technical, environmental and socio-economic challenges[J]. Journal of Modern Power Systems and Clean Energy, 2019, 7(1): 1-8. [百度学术]
杨挺,赵黎媛,王成山.人工智能在电力系统及综合能源系统中的应用综述[J].电力系统自动化,2019,43(1):2-14. [百度学术]
YANG Ting, ZHAO Liyuan, WANG Chengshan. Review on application of artificial intelligence in power system and integrated energy system[J]. Automation of Electric Power Systems, 2019, 43(1): 2-14. [百度学术]
DADANEH S Z, DOUGHERTY E R, QIAN X N. Optimal Bayesian classification with missing values[J]. IEEE Transactions on Signal Processing, 2018, 66(16): 4182-4192. [百度学术]
SONG X X, GUO Y, LI N, et al. A novel approach for missing data prediction in coevolving time series[J]. Computing, 2019, 101(11): 1565-1584. [百度学术]
杨挺,李扬,何周泽,等.基于矩阵填充的泛在电力物联网电能质量数据修复算法[J].电力系统自动化,2020,44(2):13-21. [百度学术]
YANG Ting, LI Yang, HE Zhouze, et al. Matrix completion theory based recovery algorithm for power quality data in ubiquitous power Internet of Things[J]. Automation of Electric Power Systems, 2020, 44(2): 13-21. [百度学术]
赵洪山,寿佩瑶,马利波.低压台区缺失数据的张量补全方法[J].中国电机工程学报,2020,40(22):7328-7337. [百度学术]
ZHAO Hongshan, SHOU Peiyao, MA Libo. A tensor completion method of missing data in transformer district[J]. Proceedings of the CSEE, 2020, 40(22): 7328-7337. [百度学术]
王守相,陈海文,潘志新,等.采用改进生成式对抗网络的电力系统量测缺失数据重建方法[J].中国电机工程学报,2019,39(1):56-64. [百度学术]
WANG Shouxiang, CHEN Haiwen, PAN Zhixin, et al. A reconstruction method for missing data in power system measurement using an improved generative adversarial network[J]. Proceedings of the CSEE, 2019, 39(1): 56-64. [百度学术]
刘东奇,曾祥君,王耀南.基于信息熵的智能配电变压器终端安全态势评估[J].南方电网技术,2020,14(1):18-23. [百度学术]
LIU Dongqi, ZENG Xiangjun, WANG Yaonan. Security situation assessment of intelligent distribution transformer terminal unit based on information entropy[J]. Southern Power System Technology, 2020, 14(1): 18-23. [百度学术]
黄彦钦,余浩,尹钧毅,等.电力物联网数据传输方案:现状与基于5G技术的展望[J].电工技术学报,2021,36(17):3581-3593. [百度学术]
HUANG Yanqin, YU Hao, YIN Junyi, et al. Data transmission schemes of power Internet of Things: present and outlook based on 5G technology[J]. Transactions of China Electrotechnical Society, 2021, 36(17): 3581-3593. [百度学术]
钟加勇,熊小伏,何迎春,等.面向台区智能终端的即插即用和拓扑识别方法[J].电力系统自动化,2021,45(10):166-173. [百度学术]
ZHONG Jiayong, XIONG Xiaofu, HE Yingchun, et al. Plug-play and topology identification method for intelligent terminal in distribution station area[J]. Automation of Electric Power Systems, 2021, 45(10): 166-173. [百度学术]
田世明,龚桃荣,黄小庆,等.基于电力大数据的地区E-GDP值预测[J].电力自动化设备,2019,39(11):198-204. [百度学术]
TIAN Shiming, GONG Taorong, HUANG Xiaoqing, et al. Forecasting regional E-GDP value using power big data[J]. Electric Power Automation Equipment, 2019, 39(11): 198-204. [百度学术]
范海东,王玥,李清毅,等.基于稀疏故障演化判别分析的故障根源追溯[J].控制工程,2019,26(7):1239-1244. [百度学术]
FAN Haidong, WANG Yue, LI Qingyi, et al. Sparse fault degradation oriented fisher discriminant analysis based fault trace[J]. Control Engineering of China, 2019, 26(7): 1239-1244. [百度学术]
ZHU J Y, SUN C X, LI V O K. An extended spatio-temporal granger causality model for air quality estimation with heterogeneous urban big data[J]. IEEE Transactions on Big Data, 2017, 3(3): 307-319. [百度学术]
SHI W S, CAO J, ZHANG Q, et al. Edge computing: vision and challenges[J]. IEEE Internet of Things Journal, 2016, 3(5): 637-646. [百度学术]
李钦豪,张勇军,陈佳琦,等.泛在电力物联网发展形态与挑战[J].电力系统自动化,2020,44(1):13-22. [百度学术]
LI Qinhao, ZHANG Yongjun, CHEN Jiaqi, et al. Development patterns and challenges of ubiquitous power Internet of Things[J]. Automation of Electric Power Systems, 2020, 44(1): 13-22. [百度学术]
王鹤,李石强,于华楠,等.基于分布式压缩感知和边缘计算的配电网电能质量数据压缩存储方法[J].电工技术学报,2020,35(21):4553-4564. [百度学术]
WANG He, LI Shiqiang, YU Huanan, et al. Compression acquisition method for power quality data of distribution network based on distributed compressed sensing and edge computing[J]. Transactions of China Electrotechnical Society, 2020, 35(21): 4553-4564. [百度学术]
龚钢军,罗安琴,陈志敏,等.基于边缘计算的主动配电网信息物理系统[J].电网技术,2018,42(10):3128-3135. [百度学术]
GONG Gangjun, LUO Anqin, CHEN Zhimin, et al. Cyber physical system of active distribution network based on edge computing[J]. Power System Technology, 2018, 42(10): 3128-3135. [百度学术]
聂峥,章坚民,傅华渭.配变终端边缘节点化及容器化的关键技术和应用场景设计[J].电力系统自动化,2020,44(3):154-161. [百度学术]
NIE Zheng, ZHANG Jianmin, FU Huawei. Key technologies and application scenario design for making distribution transformer terminal unit being a containerized edge node[J]. Automation of Electric Power Systems, 2020, 44(3): 154-161. [百度学术]