作者归档：闫旭函

2024-08-29组会摘要2

本次组会汇报延续之前的研究思路，继续探索电动汽车异常检测过程中的问题。主题名称为《基于电池健康状态分层加权的分布式电池异常检测方法》。

科研背景：

随着电动汽车数量的增长，人们对电动汽车充电过程的安全提出了要求。设计合理、功能完善的电池管理系统是电动汽车充电安全的保障，也是促进电动汽车发展，有效落实双碳政策的助推剂，我们在之前的研究中考虑到收集并集中处理电动汽车充电数据存在的隐私威胁，并提出将联邦学习作为我们解决隐私问题的落点。

科研问题：

在联邦学习中，数据异质性（Data Heterogeneity）指的是不同参与方的本地数据来自不同的分布。这些差异可能源于用户群体、地理位置、时间窗口等多种因素，导致数据在特征分布、标签分布等方面存在不一致性。在我们研究的问题中，由于不同车辆数据的异质性，传统生成一个单一全局模型的范式在实际异常检测应用中的性能较差。解决联邦学习存在的数据异质性问题，保护电动汽车电池安全、实现电池安全检测过程中可用性与隐私性的平衡，是我们研究的重点问题。

科研目的

在保护隐私的前提下，用联邦学习来聚合车辆数据，实现安全的电动汽车异常检测方法，保护电池安全：

提出了一种基于真实数据的电池健康状态评估方法。
使用评估的电池状态作为联邦学习聚合阶段的权重来进行个性化训练

研究内容：

第一部分我们分析了真实电动汽车健康状态，对电动汽车电池状况进行预评价、作为在模型聚合过程中的权重设置。

对于联邦学习过程我们将不同车辆视为客户端，来分析客户端之间的数据异质性，系统架构如图所示：

使用计算得到的权重对模型进行分层加权，以此提高模型对老化程度低的车辆数据的学习能力。

其他详细内容将在组会汇报中具体说明。

2024-5-30组会摘要02

本次组会主要介绍中期答辩的内容，整体结构依据毕业论文的逻辑。主题名称为《面向电动汽车电池异常的时间序列数据分析方法研究》。

科研背景：能源与环境的双重压力下，电动汽车成为解决脱碳问题的关键，电动汽车数量的增长，促进了V2G（车网互动）的发展，电动汽车充电服务作为v2G的基础，设计合理、功能完善的充电服务体系是充电服务的保障。电动汽车可以通过分布式或集中式 V2G 网络与智能电网通信，以便从电网充电或向电网放电。

科研问题：保护电动汽车电池安全、实现电池安全检测过程中可用性与隐私性的平衡，是我们研究的重点问题

研究内容与创新点如下图所示：

论文组织结构如下图所示：

2024-02-29组会摘要02

科研背景

随着储能技术进步和成本降低以及需求侧的演化发展，分布式储能在电力系统中的广泛应用是未来电网发展的必然趋势，也是突破传统配电网规划运营方式的重要途径。分布式储能安装地点灵活，与集中式储能比较，减少了集中储能电站的线路损耗和投资压力，但相对于大电网的传统运行模式，目前的分布式储能接入及出力具有分散布局、可控性差等特点。

电池储能系统（Battery Energy Storage System，简称BESS）是一个利用采锂电池/铅电池作为能量储存载体，一定时间内存储电能和一定时间内供应电能的系统，而且提供的电能具有平滑过渡、削峰填谷、调频调压等功能。受滥用、外部环境和操作条件的耐受性差的影响，电池系统可能会发生各种故障，导致电池加速退化，甚至发生安全事故，如热失控（TR）、火灾和爆炸。

科研问题

电池故障问题：现有的数据驱动的方法已经能够进行传感器数据故障识别，但这些方法所需的学习过程具有相当高的计算负担。此外，现有的方法，无论是基于模型的方法或数据驱动的方法，多是根据电压、电流等特征之间的相关性来判断电池是否故障，未考虑电池充电过程的时序变化。

隐私保护问题：在对电动汽车进行故障检测时，不可避免地会收集到电动汽车的隐私信息，传统方式是通过充电桩进行数据收集上传到云端，由此电动汽车会面临隐私泄露问题。

科研目的

提出一种基于Autoformer的故障检测方案，序列分解模块负责分解充放电序列数据，可以有效提取趋势变化和周期变化。采用对抗训练的方式最大化重构序列与原始序列之间的差距，并使用动态选择阈值方法实现故障检测。

设计一个联邦学习故障检测方案。考虑车辆充电数据上传过程中的隐私问题，设置智能充电桩作为客户端以在本地训练数据，通过中间参数的方式和中央服务器进行交互。可以根据车辆充电过程的变化识别电池故障，并保护车辆隐私数据。

研究内容

Ø实时性（Real-time nature）：现实世界场景中电池故障，有可能产生强烈的热量，或是触发TR更会导致灾难性后果。尤其是在充电过程中过充电时锂金属枝晶有可能会穿透电池引起电池故障。电动汽车在运行过程中可能遭受浸水、碰撞变形和电线故障。这都要求着我们在充电阶段就对电动汽车告警。

Ø可用性（ Usability ）：采用数据驱动的故障检测方式，能够更加准确地衡量算法在现实应用过程中的效果，但与此同时也面临着数据集中的故障原因各异、电池结构不同等情况，这对我们算法的可用性提出了要求。

Ø分布式（Distributed）：由数据驱动的故障检测不可避免地会收集到隐私信息，让数据留在本地能够有效保护电动汽车、储能电池的敏感信息。

2023-12-14组会摘要02

科研背景

在我们进行机器学习任务时，构建高质量的机器学习模型需要从不同的来源收集大量的训练数据。然而，在许多行业中，数据分散并锁定在多个组织中（例如，银行、医院和研究所），由于对数据隐私和保密性的日益关注以及相关法律法规的制定，数据共享被严格禁止。联邦学习提供了一个有力的解决方案来打破组织之间的“数据孤岛”，其中参与的客户端通过将其本地梯度更新上传到中央服务器进行聚合来协作学习全局模型，而无需共享隐私敏感数据。

为了确保没有客户端在聚合期间透露其更新，已经提出了许多方法。其中，加法同态加密（HE），特别是Paillier密码系统，在联邦学习中十分有效，因为它提供了强大的隐私保证，而不会以学习精度损失为代价。利用同态加密，可以在不预先解密密文的情况下对密文执行梯度聚合。HE已在许多联邦学习框架中应用，在训练开始之前，通过安全通道在所有客户端之间同步HE密钥对。在训练期间，每个客户端使用公钥加密其梯度更新，并将密文上传到中央服务器。服务器聚合来自所有客户端的加密梯度，并将结果分发给每个客户端。客户端使用私钥解密聚合的梯度，更新其本地模型，并继续进行下一次迭代。由于客户端仅上传加密的更新，因此服务器或外部方在数据传输和聚合期间无法了解任何信息。

科研问题

虽然同态加密为联邦学习提供了强大的隐私保证，但它执行复杂的加密操作（例如，模乘和求幂），其计算极其昂贵。实验表明，超过80%的训练迭代时间用于加密/解密。更糟糕的是，加密会产生更大的密文，比明文学习增加了150倍以上的数据传输量。HE在加密和通信中的显著开销已经成为促进联邦学习的主要障碍。因此提高同态加密联邦学习模型的通信效率十分必要。

研究目的

实现联邦学习通信阶段的效率提升，使其在经过同态加密的情况下依然能保证接近原始通信效率。

研究内容

在通信效率处理方面目前使用的方案是使用带有误差矫正的量化压缩方案，梯度处理流程如下图：

具体研究内容将在组会中讲述。

2023-10-19组会报告摘要02

本次汇报的题目是《基于Autoformer的分布式异常检测方法研究》，主要从科研背景、科研问题、科研目的、研究内容、研究计划几方面展开。

科研背景:

智能电网使用高级计量基础设施或智能电表收集用户数据，以监控电力流量，并相应地适应能源需求和供应变化。智能电表提供了额外的好处，例如快速停电检测，更快的服务恢复能力，以及通过提供详细的用电信息来更好地控制计费，从而使客户能够做出明智的决策。

智能电网容易受到各种影响，如故障设备、停电、设备故障、能源盗窃和网络攻击，这些都会导致非技术损失（NTL）。特别是，对手可能会利用网格中的安全漏洞发动复杂的网络攻击（中断服务，破坏基础设施和窃取用户数据），这可能会影响网格的正常运行。NTL可以通过检测电网中的异常来识别，这反映在智能电表收集的数据中。

科研问题：

传统机器学习方式存在以下问题：

连接性-集中式方案需要稳定的连接才能将数据持续传输到服务器。由于物联网设备通常部署在远程环境中，因此保持稳定的互联网连接可能具有挑战性。
带宽-当有数千个IoT设备参与机器学习任务时，将数据传输到集中式服务器所需的带宽可能非常大。
延迟-将数据传输到服务器，在云中运行机器学习算法，导致高延迟，影响实时应用程序。

现有的时间序列异常检测方法仍存在不足：

长序列中的复杂时间模式使得注意力机制难以发现可靠的时序依赖。
基于Transformer的模型不得不使用稀疏形式的注意力机制来应对二次复杂度的问题，但造成了信息利用的瓶颈。

科研目的：

分布式策略，使用联邦学习进行智能电网中的异常检测。由于FL中的大部分计算发生在本地设备中，因此与集中式训练相比，联邦学习中的连接性，带宽和延迟问题的影响减少了
基于Autoformer构建时间序列的异常检测模型。实现时序依赖的挖掘，进行时间序列的异常检测。

研究内容：

提出基于Autoformer网络的异常检测和诊断模型，并使用基于自相关的序列编码器来执行推理。使用基于焦点分数的自调节来实现稳健的多模态特征提取和对抗训练，以获得稳定性。针对之前提出的模型在实验过程中的表现进行改动，模型结构如下图：

2023-08-17组会摘要03

本次汇报对开题报告内容《基于联邦学习的分布式异常检测方法研究》进行介绍，主要从研究背景与意义、研究现状、研究方案、研究内容、研究计划几个方面展开。

研究背景与意义:

随着我国居民人口数不断增多，电网规模的不断提升、线路复杂度的迅速增加，给我国电网提出了新的要求。智能电网中信息技术、通信技术、计算机技术的引入大大提高了电网效率、也是电网面临着传统电网不曾考虑过的风险，也就是计算机网络安全问题。智能电网中出现的问题可以通过分析智能电表或传感器收集的数据、检测电网中的异常来识别。与此同时，我国智能电网朝着通过分布式新能源系统来实现并网消纳的方向发展。这就需要我们考虑到分布式的电网异常检测问题。

对于传统的分布式系统，在需要考虑隐私的应用程序中，数据的传输可能会被完全禁止，从而无法创建模型。而联邦学习方法训练在数据位置执行，从而保持数据隐私。但是随着深度神经网络的发展，模型变得非常复杂，每一轮迭代中变化的模型参数也大大增加，联邦学习在每一轮训练的过程中需要将这些参数上传和下发，这相较于传统的机器学习会增加巨大的通信开销。而且在整个培训过程中更新和传达的模型信息可能会暴露出用户的敏感信息。

研究现状：

目前时序数据异常检测模型发展迅速，主要分为两类，a) 针对正常数据进行训练建模，然后通过高重构误差来识别异常点，即生成式的算法，往往是无监督的。b）通过标注数据，告诉模型正常数据点长什么样，异常数据点长什么样，然后通过有监督算法训练分类模型，也称判别式算法。

在解决联邦学习通信效率方面，客户端选择、模型压缩、客户端分层、降低模型更新频率这几方面着手，而在联邦学习隐私保护方面秘密共享机制、差分隐私、同态加密都取得了不错的效果。

研究方案：

我的研究将从以下几个方面展开：分布式异常检测模型的建立，联邦学习的通信优化、联邦学习的隐私保护。

研究内容：

2023-06-01组会摘要01

本次组会对近期的研究工作《面向分布式电网异常检测模型的隐私保护》进行汇报，主要从科研背景、科研问题、科研目的以及研究进展这几方面来阐述。

科研背景

智能电网：智能电网将信息和通信技术集成到传统电网中，以管理电能的产生、分配和消耗。尽管它有许多优点，但它面临着重大挑战，例如检测网格中的异常行为。识别异常行为有助于发现不寻常的用户功耗、基础设施故障、停电、设备故障、能源盗窃或网络攻击。
异常检测：基于机器学习的智能电表数据技术在异常检测中显示出显著的效果。然而，传统的基于机器学习的异常检测需要智能电表与中央服务器共享本地数据，这引起了对数据安全和用户隐私的担忧。在分布式电网的场景下，我们想要尽可能地保证用户的隐私，基于联邦学习（FL）的智能电网异常检测受到越来越多的关注。

科研问题

随着联邦学习在各种分布式场景下的应用，联邦学习在异常检测方面存在以下挑战：

1. 对于联邦学习来说，它的通信代价远大于计算的代价，边缘设备和服务器之间通常是远程连接，带宽很低网络延迟很高，对它的实时性有着很大影响，所以我们要提升联邦学习的通信效率。

2. 由于联邦学习是整合所有数据孤岛中的数据对其进行分析挖掘，这就要求我们所有的参与节点都是可信的，在传统联邦学习中结点的可信程度决定着联邦学习的鲁棒性，这样就需要对联邦学习的聚合算法进行调整，让它可以抵御恶意节点的攻击。

3。相关文献证明了如果我们需要训练一个有效的模型，那在训练的过程中我们所使用的梯度是和原来的数据密切相关的，也就是我们在使用联邦学习时，虽没有泄露原始的数据，但仍传递了原始数据的相关信息，对其进行隐私保护是有着很重要意义的，这也是我们所研究的问题。

科研目的

本次研究旨在提出一种面向分布式电网异常检测模型的隐私保护方法，使用同态加密方法，通过对梯度进行加密来保护隐私，也不影响联邦学习的效果。具体来说，就是接将原文加密，然后联邦学习的中央服务器能够在密文上进行各种运算，最终得到结果的密文也就是我们聚合之后的梯度的加密密文。同态加密能够在不影响训练效果的情况下保护隐私，但是我们的加密的过程大大增加了我们所需要传输的数据量，因此还需要对中间传输的数据进行压缩，从而实现通信成本和隐私保护均衡的分布式异常检测模型。

研究内容

具体研究内容将在组会中讲述

研究计划

设计实验实现对联邦Transformer中间参数进行压缩，取得初步实验结果。
对原模型和压缩后的模型的中间参数进行同态加密，比较通信成本。

2023年3月30日组会报告摘要-02

我本次汇报的题目是《分布式电网中基于差分隐私的联邦异常检测方案》，我将从科研背景、科研问题、科研目的、研究内容等方面进行阐述。

科研背景

1.智能电网代表了电网发展的一个新阶段，它集成了人工智能、大数据、云计算和5G等技术进步，以管理电能的产生、分配和消耗。智能电网通常使用先进计量基础设施或智能电表来监测电力流。智能电表通过提供详细的用电信息，来实现一些目的比如快速停电检测、更快的服务恢复能力和更好的计费控制，从而使客户能够做出明智的决定。

2.智能电网也会面临各种问题，停电、设备故障、能源盗窃和网络攻击。特别是，对手可能会利用网络中的安全漏洞发动复杂的网络攻击影响电网的正常的正常运行。这些问题可以通过分析智能电表收集的数据、检测电网中的异常来识别。

科研问题

1.智能电网中的异常主要是时间序列异常

2.现有的时间序列异常检测方案大多是根据训练数据所获得的知识进行预测和重构，比较序列和重构序列的匹配程度生成异常分数。

3.对于分布式场景下的时间序列异常通常使用联邦学习的方式来进行，联邦学习本质上提供了隐私保证。但发送到服务器的一些模型参数与训练数据也是密切相关的。因此，这种无意信息泄漏的情况可能被对手利用来推断关于训练数据的信息，从而使得联邦学习容易受到推断攻击。因此，有必要通过采用其他技术来进一步加强联邦学习的隐私性和安全性。

科研目的

构建基于差分隐私的联邦transformer异常检测模型，在保护本地数据的同时，实现分布式异常检测。主要分为两个环节：构建联邦Transformer模型；使用差分隐私保护联邦Transformer的隐私。

研究内容

具体将在组会进行详细介绍

2023年1月5日组会报告摘要-01

我组会汇报的论文是《具有数据完整性的可撤销属性基加密方案》，我将从科研背景，科研问题，科研目的，研究方法和我个人的一些思考来进行介绍。

科研背景

面对当今庞大的数据量，云计算为我们存储处理数据提供了一个很好的平台。与设置内部存储和服务器不同，云计算在管理本地存储方面几乎无需维护。当数据所有者将数据外包给数据库时，因为云服务器由不受信任的第三方提供，通常会存在潜在的安全问题。确保数据机密性的一个基本方法是提供数据加密。在云数据共享技术来实现信息交互时, 用户间会将数据进行授权共享。随着数据在一组用户中共享，云计算面临着管理加密数据访问控制的挑战。现在通常会使用基于属性的加密来解决这个问题。

科研问题

在云环境中，当需要在ABE中执行撤销时，云服务器利用密文委托方法来撤销密文的访问策略。然而，授权过程不能确保相应消息的完整性。并且，由于密文委托过程是计算密集型的，云服务器可以只返回预先处理的密文甚至输出随机密文以节省其计算资源。另一个简单的解决方案是数据所有者可以下载密文并将其解密为相应的明文。然后，数据所有者可以重复加密并重新上传加密数据。这种方法要求数据所有者在每次更新策略时对数据进行解密和重新加密，这将导致数据所有者额外的计算成本。同时，从云端下载数据并在本地进行计算会带来数据维护问题。更糟糕的是，数据所有者在撤销过程中应该在线。

科研目的

保持数据完整性的同时实现从基于加密属性的加密密文的撤销；减少对数据所有者进行不必要的解密和重新加密操作；解决数据所有者在撤销过程中必须在线的约束。

具体方案及个人思考

这两个问题，将在组会中进行详细介绍

2022年10月20日组会报告摘要02

本次组会我将汇报近期学习的论文：面向云数据共享的属性基代理重加密方案，主要从以下几个方面展开：

1.科研背景：

云计算强大的存储和计算能力，让它成为了一种信息基础设施。企业也更倾向于使用云服务进行数据存储和资源共享，云服务为用户提供了一个在云上外包数据的机会，而无需担心数据管理问题。通常由第三方提供，如亚马逊云服务和阿里巴巴云。虽然云服务使用起来很方便，但数据安全和隐私，尤其是共享数据的访问控制，成了一个令人担忧的问题。

2.科研问题：

问题一是共享用户无法确保返回的重新加密密文是原始密文的正确重新加密密文本。云服务器可能会返回错误的重新加密密文，以节省计算成本。不正确的数据可能会给研究结果带来灾难。另一问题是共享用户可能会指责云服务返回错误的重新加密密文，即使重新加密的密文是正确的。这样做，共享用户可能会拒绝为云服务付费，这是商业云服务系统的一个关键问题。

3.科研目的：

实现细粒度加密数据共享，同时保持底层数据的机密性；使共享用户能够验证从云服务器返回的重新加密密文的正确性；保护云服务器，使其在返回正确的重新加密密文后免受恶意指控。

4.问题解决：

论文提出了基于属性的可验证公平密文策略代理重加密概念：介绍了云环境下基于属性的数据共享的可验证性和公平性安全要求；基于属性的可验证公平密文策略代理重加密（VF-CP-ABPRE）的概念；证明了该方案下重加密密文的语义安全性、可验证性和公平性。

5.模型评价:

模型的比较和评价将在ppt及组会报告中讲解展示。