2024-09-5组会摘要01

科研背景

随着分布式能源 (Distributed Energy Resource,DER) 单元的不断接入,传统配电网的单向电力传输方式正逐渐向主动配电网的双向电力传输方式转变,这种转变对配电网的感知、控制和协调能力提出了更高的要求。单个DER额定容量很少,但是其渗透性在不断提高。为减小风电和太阳能光伏等DER单元间隙性发电对用户侧电能质量的影响,配电网给众多馈线支路安装大量的智能电子设备 (IED)和远程终端单元(RTU) 对DER运行状况进行实时监测感知。一旦攻击者入侵至配电网通信网络,并利用恶意漏洞控制DER 单元,可能造成发电节点失效和大规模停电事件,产生不可估量的经济损失,甚至对人员造成伤亡.

基于DER智能逆变器的电网级架构

攻击模型

科研问题

1.基于模型的检测方法,易被攻击者识破:基于模型的被动式方法十分依赖于准确的模型知识如配电网网络拓扑和线路参数等。这些模型知识在配电网运行时变化很小, 因此可被当作静态信息。但是,一旦攻击者了解了防护方法的工作原理,且得到了这些静态信息,将极有可能使得基于模型的被动式方法失效

2.基于数据的检测方法,忽略了电气系统的物理拓扑结构。电力系统的不规则拓扑结构已被建模为图形,每个网格总线和分支分别直观地抽象为顶点(节点)和边。每个节点的邻域是相邻节点的集合,其中包括节点本身和通过边连接到它的节点。而在数据驱动的检测方法中,往往忽略这种拓扑结构,利用这种利用电网的底层图结构来提高检测性能是可行的。

研究目的

1.根据DERs系统物理结构信息,我们提出一个图表示学习方法,这种方法能够捕获新的结构状态信息,从而提高检测效率。
2.根据物理—信息这种复杂动态系统,采用马尔可夫决策流程 (MDP) 来有效地对网络攻击行为进行建模,并通过与从少量观察到的数据中得出的最佳奖励,自主探索内在的攻击意图,提高检测效果。

研究内容

2024-09-05组会摘要03

科研背景

图神经网络(gnn)是处理图结构数据的强大工具。图结构数据是通过图拓扑连接的数据样本。例如,分子数据是图结构数据,其中原子充当节点,连接它们的键充当图中的边。gnn可以通过考虑从底层图拓扑中提取的邻域信息来提高节点嵌入的质量。一个训练良好的GNN模型需要大量的训练图数据,这些训练图数据在实践中可能分布在多个数据所有者之间。如何在不共享实际数据的情况下协同训练GNN?最直接的方法是使用GNN执行联邦学习(FL),其中每个客户端在本地数据上单独训练本地GNN,而中央服务器将来自多个客户端的本地更新的GNN权重聚合为一个。

科研问题

研究目的

研究内容

2024-08-29组会摘要01

科研背景

FL容易受到中毒攻击在现实世界的应用程序中,一些恶意参与者可能希望通过恶意操纵他们的本地模型更新对训练的FL模型造成负面影响。这些攻击可能是非常有害的,因为即使是一小部分恶意参与者也会导致分类准确性大幅下降,并降低全局模型效用。为了减轻这些攻击并保持FL的可用性,提出了一些针对中毒攻击的防御方法。局部模型选择是通过将恶意参与者与良性参与者分离并防止恶意模型聚合来规避中毒攻击的常见方法。由于该防御方法包含大量的非线性运算,安全计算量大,因此要实现一个实用的、保护隐私的、抗中毒攻击的拜占庭鲁棒FL方案具有挑战性。

科研问题

研究目的

研究内容

2024-8-29组会摘要

题目:基于联邦学习的电动汽车充电数据安全和隐私保护研究

研究背景及意义

近年来,我国通过政策引导、补贴激励、基础设施建设等多种手段,大力推动电动汽车(EV)的发展,电动汽车在我国的普及速度显著加快,越来越多的人选择EV作为工作和日常出行的首选交通工具。
电动汽车在使用过程中会生成和收集大量的数据,这些数据能用于提升车辆性能、优化用户体验和智能交通系统的建设等等。电动汽车所收集的数据涵盖了车辆位置信息、驾驶行为、充电习惯等敏感内容,这些信息如果未能得到妥善保护,可能会被恶意利用,导致用户隐私泄露,甚至引发更严重的安全问题。
例如,通过分析充电数据,可以进行身份认证和行为分析。如,识别车主是全职司机、兼职司机还是仅用于日常通勤的用户。能够揭示车主的驾驶习惯、追踪车主的出行轨迹和行为模式等敏感信息,被未经授权的第三方用于精准广告等商业用途,数据滥用等问题。

研究问题

  • 电动汽车产生的数据分布在各个车辆本地,收集这些数据,集中处理不仅存在隐私泄露的风险,还可能面临数据合规性的挑战。传统的集中式数据处理方法在隐私保护和数据安全方面已经无法满足当前的需求。
  • 在使用联邦学习的同时,还需要确保整个数据处理流程的安全性。如何在联邦学习框架下保证数据合规性,防范可能的安全威胁,如攻击者通过参与训练过程来推断其他节点的私密数据。

研究目的

  • 开发适用于电动汽车分布式的联邦学习框架:构建一个能够在不共享原始数据的前提下,有效处理和分析电动汽车生成数据的联邦学习模型,数据无需离开本地,从而保证了用户隐私和数据安全。
  • 增强联邦学习中的隐私保护机制:设计并实施有效的隐私保护措施,以防止恶意参与者通过联邦学习过程推断其他节点的私密数据,从而提升数据处理的安全性。

研究内容

2024-08-29组会摘要2

本次组会汇报延续之前的研究思路,继续探索电动汽车异常检测过程中的问题。主题名称为《基于电池健康状态分层加权的分布式电池异常检测方法》。

科研背景:

随着电动汽车数量的增长,人们对电动汽车充电过程的安全提出了要求。设计合理、功能完善的电池管理系统是电动汽车充电安全的保障,也是促进电动汽车发展,有效落实双碳政策的助推剂,我们在之前的研究中考虑到收集并集中处理电动汽车充电数据存在的隐私威胁,并提出将联邦学习作为我们解决隐私问题的落点。

科研问题:

在联邦学习中,数据异质性(Data Heterogeneity)指的是不同参与方的本地数据来自不同的分布。这些差异可能源于用户群体、地理位置、时间窗口等多种因素,导致数据在特征分布、标签分布等方面存在不一致性。在我们研究的问题中,由于不同车辆数据的异质性,传统生成一个单一全局模型的范式在实际异常检测应用中的性能较差。解决联邦学习存在的数据异质性问题,保护电动汽车电池安全、实现电池安全检测过程中可用性与隐私性的平衡,是我们研究的重点问题。

科研目的

在保护隐私的前提下,用联邦学习来聚合车辆数据,实现安全的电动汽车异常检测方法,保护电池安全:

  • 提出了一种基于真实数据的电池健康状态评估方法。
  • 使用评估的电池状态作为联邦学习聚合阶段的权重来进行个性化训练

研究内容:

第一部分我们分析了真实电动汽车健康状态,对电动汽车电池状况进行预评价、作为在模型聚合过程中的权重设置。

对于联邦学习过程我们将不同车辆视为客户端,来分析客户端之间的数据异质性,系统架构如图所示:

使用计算得到的权重对模型进行分层加权,以此提高模型对老化程度低的车辆数据的学习能力。

其他详细内容将在组会汇报中具体说明。

2024-07-04-组会摘要01

今天主要针对我的《AC-WTGAN: An Improved Generative Adversarial Network Framework for Residential Load Profile Generation》的实验结果进行展示。

科研背景

随着能源领域的快速发展,先进计量基础设施(Advanced Metering Infrastructure, AMI)已成为智能电网的关键组成部分。AMI集成了智能电表和强大的通信网络,促进了电力公司(utility companies)与消费者之间实时、双向的数据交换。这项技术不仅改变了传统的电力计量和管理方法,还为数据驱动的能源应用奠定了坚实的基础。作为AMI的核心元素,智能电表实时测量消费者的能源使用情况,并将这些数据传输给电力公司。为了分析住宅用电量数据及相应的社会人口统计信息,机器学习在需求预测、优化电力分配以及检测窃电等任务上取得了巨大成功。

科研问题

然而,完成上述任务的关键挑战之一是居民用电数据的敏感性以及隐私法规(如欧盟的《通用数据保护条例》(GDPR)和美国的《美国数据隐私与保护法案》(ADPPA))限制了个人信息的共享。这一限制使得下游电力供应商难以利用大规模数据集开发多种用途的机器学习算法。

此外,现有的家庭用电数据集往往存在数据不平衡的问题。因为在现实世界中,一些基于社会人口学数据的家庭类型通常样本稀疏,导致现有的各种居民能源消耗数据集在数量和质量上都不平衡。高度不平衡数据样本的存在会在分类器中引入标记偏差,即分类器的决策边界易受来自多数类(majority class)的数据的影响。因此,来自少数类别(minority class)的数据实例可能会被选择性忽略,从而影响下游机器学习分类器的准确性。

为了解决这些问题,生成对抗网络(GANs)作为一种先进的时间序列生成模型备受关注。特别是GANs 可以在训练过程中从真实数据中学习复杂的分布,并生成具有类似特征的合成数据。因此,对于居民负荷的隐私问题,GANs 可以保留关键的统计模式,包括居民用电的动态和随机特征,同时对敏感信息进行匿名处理,以确保用户隐私。

针对不平衡数据的挑战,GANs 可用于生成具有相应社会人口数据的居民负荷数据从而平衡数据集,使电力公司(utility companies)能够使用大规模数据集预测需求和管理配电。

科研问题

作为原始 GAN 的改进模型,TimeGAN 专为生成时间序列数据而设计,TimeGAN 的所有网络都由循环神经网络(RNN)组成,如长短时记忆(LSTM)和门控循环单元(GRU)。虽然基于 TimeGAN 的时间序列数据生成方法取得了一些进展,但仍有一些局限性有待解决。具体来说,TimeGAN 忽略了复杂网络训练的稳定性。特别是,在生成带有社会人口学特征的居民用电数据时,TimeGAN 的不稳定性训练过程是主要由三方面造成,分别来自于 Jensen-Shannon 散度作为损失韩式的不足、带有社会人口信息的居民负荷曲线数据的内在复杂性以及长时间序列数据的长期依赖性。

此外,目前许多评估生成样本的方法主要依赖于目测(Visual Inspection, VI),而忽略了系统的评估方法,以及在训练下游机器学习模型时评估其替代真实数据的有效性,而训练数据的质量极大地影响了监督网络模型的性能。

科研目的

本文提出了TimeGAN的改进版架构,AC-WTGAN(Auxiliary Classifier Wasserstein TimeGAN),以更稳定地生成居民用电数据。

同时,我们将合成数据的评价方法系统地(systematically)分为相似性评价和可用性评价,以全面评价生成数据的质量。

研究框架

2024-7-4组会摘要02

我本次汇报的题目是《面向非侵入式负载监测的对抗攻击与防御技术研究》,将从以下几个方面进行汇报。

背景及意义

NILM系统在面对攻击者精心构造的对抗样本时具有极大的脆弱性,影响新型电力系统的稳定性和经济性。因此,开展面向NILM系统的对抗样本生成研究对挖掘目前NILM系统的潜在漏洞,从而提升其负载辨识与分解模型的鲁棒性、提高新型电力系统的稳定性具有重要意义。

科研问题

NILM的硬件成本有限,所以面向NILM的对抗样本生成方法需要有更高的时间效率;

已有的相关工作并没有关注不同数据形式在面对对抗攻击时的区别,并且时间序列数据对对抗性扰动的敏感性尚未得到充分的研究。

科研目的

设计了一种面向NILM的电力时序数据对抗样本生成方法。

研究内容

1.NILM的脆弱性分析

2.面向NILM的对抗样本生成方法

3.面向NILM的对抗防御方法

计划

完善实验细节
修改小论文
完成大论文

2024-6-20组会摘要02

论文介绍-Progressive Layered Extraction (PLE): A Novel Multi-Task
Learning (MTL) Model for Personalized Recommendations

推荐系统结构:

科研问题:

MTL并通过任务之间的信息共享被证明可以提高学习效率。然而,在现实世界的推荐系统中,任务通常是松散相关甚至相互冲突的,这可能导致性能下降,从而产生负迁移现象

MTL通常在改善某些任务的同时牺牲了其他任务的性能,产生一个目标提升其他目标下降的跷跷板现象,无法超越相应的单任务模型。

解决方案:提出个性化的门网络和渐进式的网络结构,具体过程将在组会中介绍。

2024-06-13组会摘要01

研究背景及意义

联邦学习(FL)的分布式特征使确保参与者的可信性变得困难,进而让FL系统容易遭受多种形式的攻击。在这类攻击中,由于参与者对于其对模型贡献的不透明,后门攻击尤为威胁严重。在这种攻击中,恶意行为者将特定的后门模式植入全局模型,该模式在接收特定的输入(被称为触发器)时导致模型输出错误,而在处理常规输入时表现正常。恶意攻击者通常能控制系统中的特定设备,并追求两个主要目标:(i) 使聚合模型在后门任务和常规任务上都表现出高准确性;(ii) 通过规避服务器的异常检测机制,保持后门的隐蔽性。模型替换攻击作为实施后门攻击的一种常见手段,涉及控制至少一个表面正常的设备,然后用精心设计的模型替换原聚合模型。后门攻击由于其较强的隐蔽性,对联邦学习系统构成了严重威胁,因此研究和开发有效的防御策略对于保护FL系统至关重要。

研究现状

研究内容

实验结果

2024-6-6 组会摘要02

此次组会汇报的内容为《关于推特机器人检测的相关研究》。

科研背景:Twitter bots,也称为自动程序控制的Twitter账号,它通过算法生成内容并建立交互,已经成为社交媒体用户广为人知的现象。如今它恶意应用的记录越来越多,这些推特机器人效仿人类行为,通过传播错误信息、加深社会分歧、宣扬阴谋论、影响重大选举等方式对网络社区构成威胁和挑战。

科研问题:与真实的Twitter世界相比,现有的Twitter机器人检测数据集存在规模有限,图结构不完整和标注质量差的问题。并且,随着机器人的不断进化,它以一种或多种方式操纵其信息,在时间点上表现出不一致性,给检测带来更多挑战。

科研内容如下:

现有想法: