摘要
虚拟电厂是通过聚合管理各类需求侧资源参与电力市场交易、提供辅助服务和实现点对点交易的有效途径。针对传统虚拟电厂内部进行交易决策优化过程中存在的信息篡改和隐私泄露等问题,提出一种基于主侧区块链结构的虚拟电厂分布式交易决策优化方法。为了激励聚合商参与点对点交易市场,设计了一种结合自适应定价机制的虚拟电厂聚合商点对点交易机制。为防止优化过程中不诚实的聚合商篡改交互信息,基于主侧区块链提出一种改进的实用拜占庭容错共识算法。为进一步防止信息交互导致的隐私泄露,提出一种基于Shamir秘密共享方案的信息加密和解密算法。最后,通过算例分析验证了所提方法在交易决策优化、防篡改和隐私保护方面的优越性。
为有效应对大规模可再生能源并网对电网稳定运行带来的挑
VPP交易决策架构可以是集中式
区块链是一种分布式共享数据库,聚合商可以利用共识机制通过各自节点共同监督链上交互数据,实现信息安全共
为保护区块链上的数据隐私,文献[
为实现VPP分布式决策优化过程中不同聚合商交互信息的隐私保护和防篡改,本文提出一种基于主侧区块链结构的VPP分布式交易决策优化方法。首先,为以降低聚合商总成本的手段来激励其参与P2P交易市场,本文结合反映供需平衡程度的MMR定价策略,设计了一种面向VPP聚合商的P2P交易机制,在优化性能与集中式方法相近的情况下,通过分布式优化实现了成本的降低。其次,为实现去信任化的分布式交易过程,本文基于主侧区块链结构,提出一种改进的PBFT共识算法,在存在不诚实行为的情况下仍能避免信息被篡改。然后,为防止信息交互过程中的隐私泄露,提出一种基于Shamir秘密共享方案的加密和解密算法,保证全过程交易决策信息始终为密文,结合主侧区块链架构的特点,实现了交易决策优化全过程的隐私保护。最后,通过理论分析和算例分析,论证了本文所提方法在交易决策优化、防篡改和隐私保护方面的优越性。
本文中的VPP有多家聚合商参与,签约资源包括光伏(photovoltaic,PV)系统和电动汽车(electric vehicle,EV)。由于在本文的优化过程中不考虑通过切断PV提供灵活性,采用的PV系统出力为固定数据;而对于EV而言,为有效利用其作为储能资源的上下调潜力,建立了EV集群的虚拟储能模型。同时,在P2P交易市场中,分别针对各聚合商基于VPP内部交易电价进行交易决策优化,实现各聚合商交易成本最低的目标。
为参与P2P交易市场,聚合商需根据历史数据评估EV集群可调节能力。而为了简化大规模EV规划问题及聚合商间交易决策优化所需的复杂约束条件,可通过虚拟储能模型实现各EV集群可调节能力的量化。虚拟储能模型表征为功率边界、能量边界和阶跃能量变化,可有效减少决策变量和约束条
考虑到用户用能诉求的差异化,本文将有离网状态的EV记为非闲置EV,而无离网状态的EV则记为闲置EV。假设EV只在每时段开始或结束时并网和离网,且同时段内的EV充电功率恒定。其中,闲置EV因一直处于并网状态相当于一个储能系统,在并网时刻到离网时刻内,将闲置的能量边界上限和下限分别定义为EV电池容量上限和下限,并将闲置的功率边界上限和下限分别定义为EV充放功率的最大值和最小值。需要说明的是,和的设置中已考虑充放电效率。
相比于闲置EV,非闲置EV的功率边界定义与闲置EV相同,而由于非闲置EV存在离网和并网两种状态,需要考虑时的初始能量以及时的能量期望。因此,将其能量边界重新定义为:
(1) |
(2) |
式中:和分别为非闲置的并网持续时长和离网剩余时长;为非闲置的并网初始能量;为非闲置的离网能量期望。
计算得到单台EV功率边界和能量边界后,可利用闵可夫斯基求和方法算得EV集群虚拟储能模型的3种表征量,在附录A中进行了详细描述。
本文所提VPP内部交易决策优化模型以主侧区块链为框

图1 VPP内部交易决策优化架构
Fig.1 Architecture of internal transaction decision optimization in VPP
主链节点分别由电网公司、VPP运营商和聚合商管理。其中,由电网公司调度部门管理的调度代理节点负责电网运行相关的安全核验,而由电网公司营销部门管理的营销代理节点则负责交易安全校验,这两个节点也被定义为主链上的电网公司代理片区。此外,根据节点功能还定义了共识委员会片区和聚合商片区。每条侧链对应着一家VPP聚合商,其管理着用于连接主链和侧链的锚定节点,而其他侧链节点则由各PV或EV集群资源签约主体管理。得益于主侧链结构与分布式优化方法,各聚合商内部交易决策信息的记录及优化只需在对应侧链上完成。由于信息仅在同级别被授权主体间共享而其他聚合商无法获知,隐私得到了保护。
在聚合商片区,各聚合商分别根据共识委员会给定的内部交易电价,以日电能交易成本最低为目标进行优化。在考虑了EV集群约束的情况下,对其充放电功率曲线进行优化求解,进而求得各聚合商自身的交易决策并将其提交给共识委员会。各聚合商优化的目标函数及约束为:
(3) |
式中:运算符分别代表取与0之间的最大值和最小值;为第个聚合商的成本函数;和分别为时段的内部买入价和卖出价;和分别为第个聚合商的EV集群在时段的功率决策变量和能量决策变量;和分别为第个聚合商的EV集群在时段的充放电功率上、下限;和分别为第个聚合商的EV集群在时段的能量上、下限;为第个聚合商的EV集群在到时段内的阶跃能量变化;为第个聚合商在时段的PV发电功率;和分别为第个聚合商在时段的净负荷和净发电量(),由和的计算公式可知,第个聚合商在时段的功率;为每时段的时长。
而在共识委员会片区上,各代表需要利用各聚合商提交的电量交易决策,来制定VPP内部交易电价。考虑到在本文提出的优化模型中,各聚合商优先参与P2P交易市场并做出各自交易决策,即在电能供应不足时,优先做出向其他聚合商购买决策;当电能供应过剩时,优先做出向其他聚合商出售决策。为了激励聚合商参与P2P交易市场,本文采用MMR定价机
优化问题在主侧链之间通过信息传递来进行迭代求解,当满足交易电价不再变化的收敛条件
(4) |
式中:为一个足够小的正数。
结合主侧区块链框架,考虑到聚合商向主链的共识委员会提交的信息仍面临泄露的风险。此外,共识委员会也可能存在不诚实代表,导致信息篡改和隐私泄露等问题的发生。为解决上述问题,本文提出了一种VPP隐私保护方法。
在本文的VPP隐私保护架构中,主、从代表节点共同构成了主链的共识委员会片区,负责根据聚合商交易决策密文来更新内部交易电价,同时确保交易决策信息不被篡改或泄露。必须澄清的是,聚合商是否担任主代表或从代表对于P2P交易本身并无影响,选举代表是为了赋予部分高信用聚合商参与共识过程的权力。所有聚合商节点组成的主链聚合商片区则负责将交易决策迭代优化并不断加密提交至共识委员会,最终根据最优交易决策参与P2P交易市场。
所有共识过程的启动由共识委员会主代表引导,其责任重大。VPP运营商承担了聚合商身份验证等重要责任,在VPP运行初期是最具信任度的主体,故选择其为首任主代表,编号为1。若主代表在第i次迭代过程中存在不诚实行为,改进共识算法的视图更换子协议允许委员会更换聚合商作为主代表,并重新进行该次迭代的共识过程。而从代表则由所有聚合商投票选举产生,即在迭代过程开始之前,各聚合商都可以投票选出一位代表,按照得票数量对聚合商进行降序排列,选取前个聚合商担任从代表,并从2开始依次对从代表进行编号。
本文采用的VPP隐私保护算法主要分为加密、共识以及解密3种算法,隐私保护算法总流程如

图2 隐私保护算法流程图
Fig.2 Flow chart of privacy preservation algorithm
为保证交易决策信息在上传和共识的全过程保持密文形式,本文在侧链提出一种基于Shamir秘密共享方案的加密算法,其主要思想为利用该秘密共享方案对交易决策信息进行加密拆分处理,并分别上传给不同代表。加密算法流程分为初始化和密文分发两阶段。
在初始化阶段,首先设置秘密共享方案的门限为,即原始信息被加密生成M组密文,而解密则需要不少于p+1组密
(5) |
式中:和分别为时段第个聚合商发送给第个代表的加密净负荷和加密净发电量。
在密文分发阶段,聚合商以代表编号作为多项式的输入值,生成M组电量交易决策密文,每组决策密文如
(6) |
(7) |
式中:和分别为第个聚合商发送给第个代表的下一自然日加密净负荷和加密净发电量;为当前视图号。
此外,Shamir秘密共享方案具有加法同态性。在不解密的情况下,对决策密文直接进行加法运算,仍能解密出对原决策信息进行求和的结果。该性质使得代表解密后只能得到交易决策聚合值,而无法获得聚合商单独交易决策,保护了聚合商的隐私信息。
在现实中,聚合商可能会为了获利而故意违背共识规则、散布错误消息或利用不正当手段获取篡改交易决策等隐私数据。这些不诚实行为妨碍了VPP的公平交易和隐私安全,为削弱其影响,本文提出一种用于主链的基于改进验证规则的PBFT共识算法。在共识委员会的不诚实代表数量小于代表总数量1/4的情况下,即,该共识算法仍能保证解密出正确的原始决策信息,从而计算出正确的交易电价。改进PBFT共识算法主要分为请求、预准备、准备、提交和回复5个主要阶段,以及一个若主代表有不诚实行为而触发的视图更换阶段。本文算法的视图更换阶段与PBFT共识算法中的对应阶段流程相似,在附录C中进行详细描述。
首先,在请求阶段,代表接收聚合商发送的请求消息。当请求消息全部发送完毕后,进入下一阶段。
在预准备阶段,主代表根据请求消息里包含的聚合商编号n生成第次迭代的聚合商参与集,作为收到所有聚合商密文的证明,并将其打包成预准备消息发送给所有从代表,预准备消息格式如
(8) |
在准备阶段,从代表收到预准备消息时,要对预准备消息的合法性进行以下验证:1)验证收到的是否与代表自身编号相符;2)验证收到的是否与当前视图号相同;3)识别收到的,验证是否已收到全部聚合商的请求消息。通过验证的从代表会向所有代表发送准备消息,准备消息格式如
(9) |
在提交阶段,当一个代表收到不少于3p条具有相同的准备消息时,其利用
(10) |
(11) |
式中:和分别为第个代表计算的净负荷密文聚合值和净发电密文聚合值。
在回复阶段,当一个代表收到不少于条提交消息时,说明多数代表已经完成了和的计算。此时,该代表根据解密算法得到原始交易决策聚合值,更新交易电价并通过收敛条件
(12) |
式中:为第次迭代更新的交易电价信息,包括下一自然日的和;为是否收敛的二进制指标,1代表为收敛结果,反之则为0。
在时,所提隐私保护方法可实现隐私保护和真实交易决策结果共识达成。本节从防篡改性能和隐私保护性能两个维度,对方法性能进行分析。
在共识过程中,诚实代表可能解密出不诚实代表传递的错误消息。因此,个不诚实代表会造成至多个诚实代表提交错误消息,加上不诚实代表本身提交的条错误消息,最终导致共识委员会解密得到至多组错误结果。若想保证共识委员会此时仍可做出正确判断,则必须接收到组正确提交结果。因此,针对个不诚实代表,至少需要个代表才能保证复原出真实交易决策结果。若不诚实代表占比高于1/4,则可能会出现提交的正确消息少于错误消息而导致共识委员会得到错误交易决策结果。而比例设置低于1/4虽可保证共识委员会得到正确的交易决策结果,但会削弱对不诚实行为的抵御能力。因此,本文中不诚实代表数量是权衡安全性和适用性的结果。
此外,当主代表存在篡改信息行为导致共识过程无法正常进行时,视图更换阶段自动触发。在该阶段,当新主代表接收到不少于3p条视图更换执行消息时,证明该主代表已得到诚实代表的确认。而通过更换新主代表,可以避免共识和解密过程受到不诚实主代表的影响。因此,本文提出的VPP隐私保护方法可以在考虑不诚实主从代表的情况下,保证交易决策信息不被恶意篡改。
为验证所提方法在优化、防篡改和隐私保护方面的有效性,本文展示了一系列算例结果。其中,规定每个聚合商由包含100辆EV的集群及PV系统组成,而聚合商数目则是根据实验需要设定。运行环境配置如下:操作系统版本为Windows 11,主机处理器为2.90 GHz Intel Core i5-10400F CPU,算法实现平台为MATLAB2021a,求解器为CPLEX12.9。考虑到PV出力和EV集群充放电的不确定性可能会对交易决策产生影响,本文参照文献[
对于生成的EV集群场景,为方便计算其虚拟储能模型边界,本文对每个集群中的EV取相同参数:为 kW∙h,为 kW∙h,为4 kW,为。为模拟出现实中EV的行为习惯,将EV分为闲置车辆和非闲置车辆,其中,非闲置车辆被进一步分为3种类型。非闲置EV类型及对应随机变量服从的分布函数如
注: 表示参数服从均匀分布;表示参数服从正态分布。
对于参与P2P交易市场的电价,本文借鉴美国电力市场对分时电价和上网电价的制定情

图3 最终交易决策优化结果
Fig.3 Final optimization results of transaction decisions
为了更加直观地对比分布式优化和集中式优化方法,

图4 交易决策优化结果对比(平均功率)
Fig.4 Comparison of optimization results of transaction decisions (average power)

图5 VPP内部电价及总成本
Fig.5 Internal price and total cost of VPP
无论是集中式优化还是分布式优化方法,其运行时间都随着VPP内聚合商数目增加而增加。而在不同规模的VPP中,虽然分布式优化方法比集中式优化方法需要更长的运行时间,但其单次迭代依然高效且交易决策优化总时长完全满足日前市场实际需求。
在本文中,假设代表5为不诚实代表。若不采用共识算法,可能会导致该代表篡改功率信息,进而增加其操纵电价制定的风险。由于缺乏共识算法,VPP无法保证所有聚合商就功率信息的一致性达成统一。为向某些聚合商提供额外的利润,代表5会篡改信息或发送错误信息,严重影响交易的公平性。对于本文利用的改进PBFT共识算法,如

图6 受不可信代表影响的解密结果
Fig.6 Decryption results affected by untrusted delegate
以代表1的加密解密数据为例,

图7 代表加密/解密结果
Fig.7 Encryption/decryption results of delegates
以不诚实代表5收到的聚合商8的功率信息为例,将基于本文方法和基于PBFT共识算法的隐私保护效果进行对比,如

图8 代表收到功率数据的差异
Fig.8 Differences between power data received by delegates
本文基于主侧区块链结构,提出一种能够实现信息防篡改和隐私保护的VPP分布式交易决策优化方法。理论与算例分析表明:
1)相比于集中式优化方法,本文提出方法在与集中式方法的优化性能保持相近的前提下,降低了聚合商总成本,从而激励聚合商积极参与P2P交易市场。
2)本文提出的改进PBFT共识算法消除了传统共识算法在存在不诚实行为情况下的局限性,即本文共识算法可以在存在一定篡改行为的前提下,保证最终交易信息的正确性。
3)通过本文的加密和解密算法对交易决策信息进行加密,并在优化全程保持其密文状态,可以有效保证聚合商的隐私不被泄露。
本文提出的共识算法,考虑在每次迭代的共识过程中,根据提交消息包括的聚合商生成聚合商参与集,但由于可能因通信故障导致聚合商在某次迭代中暂时离线,造成优化收敛性受到影响。因此,未来可以研究一定数量聚合商在迭代中离线的情况下,优化仍可以正常收敛的共识算法。
附录
EV集群的功率边界定义为:
(A1) |
(A2) |
能量边界为:
(A3) |
式中:为各集群中EV的数量;为二进制表示的时段并网状态,1为并网,反之则为0;和分别为时段EV集群的充放电功率上、下限;和分别为时段EV集群的能量上、下限。
定义非闲置在每时刻因并网或离网出现的能量阶跃变化为和,则其能量阶跃变化可由
(A4) |
因此,在EV集群储能模型构建过程中还需考虑由非闲置造成的阶跃能量变化,即结合二进制变量将EV集群能量定义为
(A5) |
式中:和为非闲置EV和闲置EV集合;为在到时段内使EV集群模型发生的阶跃能量变化,由于闲置EV不存在离网状态,所以其阶跃能量变化取0;为EV集群模型整体的阶跃能量变化。
在第次迭代中,时段的内部购售电价和根据该时段的VPP供需差异制定,定义分别如
(B1) |
(B2) |
式中:为VPP内聚合商数量;和分别为时的上网和分时电价;、和分别为第次迭代时段的VPP总需求、总发电量和总功率。

图C1 隐私保护算法信息交互过程
Fig.C1 Information interaction process in privacy-preserving algorithm
若在第i次迭代的共识过程中,从代表发现主代表有不诚实行为,或最终聚合商未能收到至少条回复消息时,触发视图更换阶段,从代表或聚合商向所有代表发送视图更换消息。此时,代表只接受视图更换消息
(C1) |
(C2) |
(C3) |
(C4) |
式中:为新视图号;为新主代表编号。
参 考 文 献
孙国强,袁智,耿天翔,等.含电动汽车的虚拟电厂鲁棒随机优化调度[J].电力系统自动化,2017,41(6):44-50. [百度学术]
SUN Guoqiang, YUAN Zhi, GENG Tianxiang, et al. Robust stochastic optimal dispatching of virtual power plant containing plug-in electric vehicles[J]. Automation of Electric Power Systems, 2017, 41(6): 44-50. [百度学术]
赵昊天,王彬,潘昭光,等.支撑云-群-端协同调度的多能园区虚拟电厂:研发与应用[J].电力系统自动化,2021,45(5):111-121. [百度学术]
ZHAO Haotian, WANG Bin, PAN Zhaoguang, et al. Research and application of park-level multi-energy virtual power plants supporting cloud-cluster-end multi-level synergetic dispatch[J]. Automation of Electric Power Systems, 2021, 45(5): 111-121. [百度学术]
殷爽睿,艾芊,宋平,等.虚拟电厂分层互动模式与可信交易框架研究与展望[J].电力系统自动化,2022,46(18):118-128. [百度学术]
YIN Shuangrui, AI Qian, SONG Ping, et al. Research and prospect of hierarchical interaction mode and trusted transaction framework for virtual power plant[J]. Automation of Electric Power Systems, 2022, 46(18): 118-128. [百度学术]
郑重,苗世洪,李超,等.面向微型能源互联网接入的交直流配电网协同优化调度策略[J].电工技术学报,2022,37(1):192-207. [百度学术]
ZHENG Zhong, MIAO Shihong, LI Chao, et al. Coordinated optimal dispatching strategy of AC/DC distribution network for the integration of micro energy Internet[J]. Transactions of China Electrotechnical Society, 2022, 37(1): 192-207. [百度学术]
KUZLE I, ZDRILIĆ M, PANDŽIĆ H. Virtual power plant dispatch optimization using linear programming[C]// 2011 10th International Conference on Environment and Electrical Engineering, May 8-11, 2011, Rome, Italy: 1-4. [百度学术]
ZDRILIĆ M, PANDŽIĆ H, KUZLE I. The mixed-integer linear optimization model of virtual power plant operation[C]// 2011 8th International Conference on the European Energy Market (EEM), May 25-27, 2011, Zagreb, Croatia: 467-471. [百度学术]
YANG H M, YI D X, ZHAO J H, et al. Distributed optimal dispatch of virtual power plant via limited communication[J]. IEEE Transactions on Power Systems, 2013, 28(3): 3511-3512. [百度学术]
张涛,王成,王凌云,等.考虑虚拟电厂参与的售电公司双层优化调度模型[J].电网技术,2019,43(3):952-960. [百度学术]
ZHANG Tao, WANG Cheng, WANG Lingyun, et al. A bi-level optimal dispatching model of electricity retailers integrated with VPPs[J]. Power System Technology, 2019, 43(3): 952-960. [百度学术]
YE Y J, TANG Y, WANG H Y, et al. A scalable privacy-preserving multi-agent deep reinforcement learning approach for large-scale peer-to-peer transactive energy trading[J]. IEEE Transactions on Smart Grid, 2021, 12(6): 5185-5200. [百度学术]
BODDAPATI K M, PATNE N R, MANCHALWAR A D. Energy trading in prosumer based smart grid integrated with distributed energy resources[C]// 2022 International Conference on Intelligent Controller and Computing for Smart Power (ICICCSP), July 21-23, 2022, Hyderabad, India: 1-5. [百度学术]
KAVOUSI-FARD A, ALMUTAIRI A, AL-SUMAITI A, et al. An effective secured peer-to-peer energy market based on blockchain architecture for the interconnected microgrid and smart grid[J]. International Journal of Electrical Power & Energy Systems, 2021, 132: 107171. [百度学术]
REGUEIRO C, SECO I, DE DIEGO S, et al. Privacy-enhancing distributed protocol for data aggregation based on blockchain and homomorphic encryption[J]. Information Processing & Management, 2021, 58(6): 102745. [百度学术]
潘登,朱国胜,杨倩.基于贡献值和信誉度的区块链共识机制[J].计算机应用,2022,42(增刊1):166-172. [百度学术]
PAN Deng, ZHU Guosheng, YANG Qian. Consensus mechanism of blockchain based on contribution value and credit value[J]. Journal of Computer Applications, 2022, 42(S1): 166-172. [百度学术]
刘淳,王仕俊,赵燕玲,等.区块链技术在虚拟电厂交易中的应用综述[J].电力建设,2023,44(4):130-144. [百度学术]
LIU Chun, WANG Shijun, ZHAO Yanling, et al. Review of the application of blockchain technology in virtual power plant transactions[J]. Electric Power Construction, 2023, 44(4): 130-144. [百度学术]
任建文,张青青.基于能源区块链的虚拟电厂两阶段鲁棒优化调度[J].电力自动化设备,2020,40(8):23-30. [百度学术]
REN Jianwen, ZHANG Qingqing. Two-stage robust optimal scheduling of virtual power plant based on energy blockchain[J]. Electric Power Automation Equipment, 2020, 40(8): 23-30. [百度学术]
KASHYAP R, ARORA K, SHARMA M, et al. Security-aware GA based practical Byzantine fault tolerance for permissioned blockchain[C]// 2019 4th International Conference on Control, Robotics and Cybernetics (CRC), September 27-30, 2019, Tokyo, Japan: 162-168. [百度学术]
YIN S R, AI Q, LI J M, et al. Trading mode design for a virtual power plant based on main-side consortium blockchains[J]. Applied Energy, 2022, 325: 119932. [百度学术]
ZHAO H T, WANG B, PAN Z G, et al. Aggregating additional flexibility from quick-start devices for multi-energy virtual power plants[J]. IEEE Transactions on Sustainable Energy, 2021, 12(1): 646-658. [百度学术]
GARG S, KAUR K, KADDOUM G, et al. An efficient blockchain-based hierarchical authentication mechanism for energy trading in V2G environment[C]// 2019 IEEE International Conference on Communications Workshops (ICC Workshops), May 20-24, 2019, Shanghai, China: 1-6. [百度学术]
AITZHAN N Z, SVETINOVIC D. Security and privacy in decentralized energy trading through multi-signatures, blockchain and anonymous messaging streams[J]. IEEE Transactions on Dependable and Secure Computing, 2018, 15(5): 840-852. [百度学术]
TIAN N F, GUO Q L, SUN H B, et al. Fully privacy-preserving distributed optimization in power systems based on secret sharing[J]. iEnergy, 2022, 1(3): 351-362. [百度学术]
吴界辰,艾欣,胡俊杰.需求侧资源灵活性刻画及其在日前优化调度中的应用[J].电工技术学报,2020,35(9):1973-1984. [百度学术]
WU Jiechen, AI Xin, HU Junjie. Methods for characterizing flexibilities from demand-side resources and their applications in the day-ahead optimal scheduling[J]. Transactions of China Electrotechnical Society, 2020, 35(9): 1973-1984. [百度学术]
荣辉桂,莫进侠,常炳国,等.基于Shamir秘密共享的密钥分发与恢复算法[J].通信学报,2015,36(3):64-73. [百度学术]
RONG Huigui, MO Jinxia, CHANG Bingguo, et al. Key distribution and recovery algorithm based on Shamir’s secret sharing[J]. Journal on Communications, 2015, 36(3): 64-73. [百度学术]
ZHENG X T, XU N, TRINH L, et al. A multi-scale time-series dataset with benchmark for machine learning in decarbonized energy grids[J]. Scientific Data, 2022, 9(1): 359. [百度学术]
QIU D, CHEN T Y, STRBAC G, et al. Coordination for multienergy microgrids using multiagent reinforcement learning[J]. IEEE Transactions on Industrial Informatics, 2022, 19(4): 5689-5700. [百度学术]