分类目录归档:其他

2024-5-30组会摘要02

本次组会主要介绍中期答辩的内容,整体结构依据毕业论文的逻辑。主题名称为《面向电动汽车电池异常的时间序列数据分析方法研究》。

科研背景:能源与环境的双重压力下,电动汽车成为解决脱碳问题的关键,电动汽车数量的增长,促进了V2G(车网互动)的发展,电动汽车充电服务作为v2G的基础,设计合理、功能完善的充电服务体系是充电服务的保障。电动汽车可以通过分布式集中式 V2G 网络与智能电网通信,以便从电网充电或向电网放电。

科研问题:保护电动汽车电池安全、实现电池安全检测过程中可用性与隐私性的平衡,是我们研究的重点问题

研究内容与创新点如下图所示:

论文组织结构如下图所示:

2024-05-23-组会摘要01

今天主要从写作行文的角度来对我的研究《AC-WTGAN: An Improved Generative Adversarial Network Framework for Residential Load Profile Generation》进行介绍。

科研背景

随着能源领域的快速发展,先进计量基础设施(Advanced Metering Infrastructure, AMI)已成为智能电网的关键组成部分。AMI集成了智能电表和强大的通信网络,促进了电力公司(utility companies)与消费者之间实时、双向的数据交换。这项技术不仅改变了传统的电力计量和管理方法,还为数据驱动的能源应用奠定了坚实的基础。作为AMI的核心元素,智能电表实时测量消费者的能源使用情况,并将这些数据传输给电力公司。为了分析住宅用电量数据及相应的社会人口统计信息,机器学习在需求预测、优化电力分配以及检测窃电等任务上取得了巨大成功。

科研问题

然而,完成上述任务的关键挑战之一是居民用电数据的敏感性以及隐私法规(如欧盟的《通用数据保护条例》(GDPR)和美国的《美国数据隐私与保护法案》(ADPPA))限制了个人信息的共享。这一限制使得下游电力供应商难以利用大规模数据集开发多种用途的机器学习算法。

此外,现有的家庭用电数据集往往存在数据不平衡的问题。因为在现实世界中,一些基于社会人口学数据的家庭类型通常样本稀疏,导致现有的各种居民能源消耗数据集在数量和质量上都不平衡。高度不平衡数据样本的存在会在训练有素的分类器中引入标记偏差,即分类器的决策边界倾向于主要受来自多数类的大量数据的影响。因此,来自少数类别的数据实例可能会被选择性忽略,从而影响下游机器学习分类器的准确性。

作为原始 GAN 的改进模型,TimeGAN 专为生成时间序列数据而设计,TimeGAN 的所有网络都由循环神经网络(RNN)组成,如长短时记忆(LSTM)和门控循环单元(GRU)。虽然基于 TimeGAN 的时间序列数据生成方法取得了一些进展,但仍有一些局限性有待解决。具体来说,TimeGAN 忽略了复杂网络训练所产生的稳定性。特别是,在生成带有社会人口学特征的居民用电数据时,TimeGAN 的不稳定性训练过程是主要由三方面造成,分别来自于 Jensen-Shannon 散度的不足、带有相应社会人口信息的居民负荷曲线数据的内在复杂性以及长时间序列数据的长期依赖性。

此外,目前许多评估生成样本的方法主要依赖于目测(Visual Inspection, VI),而忽略了系统的评估方法,以及在训练下游机器学习模型时评估其替代真实数据的有效性,而训练数据的质量极大地影响了监督网络模型的性能。

科研目的

本文提出了TimeGAN的改进版架构,AC-WTGAN(Auxiliary Classifier Wasserstein TimeGAN),以更稳定地生成居民用电数据。

同时,我们将评价方法系统地(systematically)分为相似性评价和可用性评价,以全面评价生成数据的质量和数量。

2024-04-25组会摘要01

科研背景及意义

由于联邦学习(FL)的分布性,很难确保每个参与者都是可信的,因此FL框架很容易受到各种攻击。在这些针对FL的攻击中,由于参与者对模型的贡献缺乏透明度,系统很容易受到后门攻击的威胁。具体来说,恶意攻击者会将后门模式嵌入到全局模型中,使其在特定输入(称为触发器)下产生不正确的输出,而在常规输入下正常运行。一般来说,恶意后门攻击者拥有控制 FL 中某些设备的权限,并实现两个主要目标: (i) 确保聚合模型对后门任务和主任务都具有高准确性;(ii) 避免服务器的异常检测,从而保持嵌入后门的隐蔽性。目前,模型替换攻击是在 FL 中发起后门攻击最常用的方法,攻击者只需控制一个良性设备,然后用精心制作的模型替换聚合模型。后门攻击的隐蔽性较强,给联邦学习系统造成了严重威胁,因此对联邦学习后门攻击进行防御,成为了重要的研究课题。

科研问题

1、基于异常检测的方法用于识别和删除潜在中毒的模型更新。然而,这些解决方案仅在非常特定的对手模型下有效,因为它们对对手的攻击策略和/或良性或敌对数据集的潜在分布进行了详细的假设。

2、差分隐私(DP)技术适用于通用的对手模型,无需对对手行为和数据分布进行特定假设,并且可以有效消除恶意模型更新。但DP方法会导致良性模型更新权重的显著修改,从而使主任务准确性降低。

科研目的

1、结合了两种防御类型的优点,而不受现有方法的限制(对数据分布的假设)和缺点(良性性能损失)的影响。为此,我们引入了一种防御方法,其中异常模型更新的检测和权重的裁剪相结合,以最大限度地减少聚合模型的后门移除所需的噪声量,以便保持其良性性能。

2、对该防御策略进行安全性分析,从理论上保证了此防御策略的有效性。

科研内容

2024-4-11组会摘要02

我本次汇报的题目是《面向非侵入式负载监测的对抗攻击与防御技术研究》,将从以下几个方面进行讲述:

背景及意义

电能作为能源的重要组成部分,近年来消耗增长迅速,其消费结构直接关系国家能源安全。高级计量体系(Advanced metering infrastructure, AMI)是电网获取海量运行数据的主要技术手段之一,是电网数字化转型的重要支撑。负荷监测技术作为AMI的重要组成部分,在促进用户参与需求侧响应的价值正逐渐显现。非侵入式负荷监测(Non-intrusive load monit oring, NILM)技术是实现负荷运行状态监测的主要方法。NILM技术作为高级量测体系中的重要环节,已逐渐成为成为网-荷良性友好互动,负荷侧精细化电能管理的研究重点。非侵入式负荷监测得到的信息对于各用电参与方都有很大的实用价值。

为了提高非侵入性负荷分解的准确性和泛化能力,近年来研究者将注意力转向了新出现的深度学习领域。随着研究的不断深入,研究者发现深度神经网络在恶意制造的对抗样本面前表现出了极大的脆弱性。

研究现状

1大量的研究集中在设计白盒攻击和相应的防御上。白盒攻击假定攻击者知道很多信息,比如被攻击网络的梯度。在实际场景中,攻击者可能无法访问模型的参数。
2现有的对抗性示例生成模型大多是在特定的数据集上训练的,缺乏可移植性,需要在真实的物理场景中验证攻击效果。
3一些对抗性示例生成技术的计算复杂度过高。虽然实现了较高的攻击成功率,但增加了计算量,导致训练模型过大。如C&W和PGD-20,是耗时的。如果对手的攻击时间过长,就很容易被发现。

研究问题

科研目的

设计一种黑盒下面向非侵入式负载监测的轻量级对抗性攻击方法

研究内容

1非侵入式负载监测

2对抗攻击产生的原因

3基于AdvGan的对抗攻击

2024-04-11组会摘要03

科研背景

近年来,深度学习在图像处理任务中得到广泛应用,比如在自动驾驶、医学图像分析等领域,取得了显著进展。然而,随着数据的广泛应用,隐私泄露和保护成为了一个日益突出的问题。
差分隐私(DP)通过向数据集添加外部噪声来保护已发布的模型,但未能保护图像数据的视觉隐私,因为产生的高频域噪声可以被人眼过滤。其次,数据集和特征图上的额外噪声可能会显著降低DNN模型的准确性。

科研问题

图像数据已被广泛用于各种场景中的深度神经网络(DNN)任务,例如自动驾驶和医学图像分析,这引起了严重的隐私问题。

现有的隐私保护技术无法有效保护曝光图像数据的视觉特征问题。

研究目的

提出一种新的隐私保护框架VisualMixer,该框架通过像素混洗来保护视觉DNN任务的训练数据,同时保持DNN模型的准确性。

研究内容

2024.03.28-组会摘要01

今天主要对我的研究基于AC-TimeGAN模型的电力时序数据生成研究进行汇报

科研背景

随着先进计量基础设施(Advanced Metering Infrastructure, AMI)的出现使得人们能够以细粒度的时间分辨率分析住宅负荷特性,这种数字化计量基础设施通常被视为能源转型的一个推动者。在用电测,它不仅仅简化了电能的计量,更重要的是为住宅用户提供了便利,通过数据的精准采集和实时监控,居民能够更清晰地了解自己的能源使用情况,从而做出更加节能的决策。

科研问题

因此,在电力行业中,智能电表的广泛部署使得使用人工智能技术来细致分析用户的用电数据变得可行。然而,这些技术为了高效训练通常需要大量有代表性的数据集。因此带来了下面的挑战:

•收集这些数据面临着显著的安全和隐私挑战

•高质量的公开数据集也相对稀缺

为了解决上述的挑战,使用合成数据(Synthetic Data)代替原始数据来进行下游的机器学习训练成为了一种可行的方案。在时间序列领域,时间序列生成对抗网络(Time-series Generative Adversarial Networks,TimeGAN)这一GAN的变种进一步扩展了这一领域,为电力时间序列数据的生成提供了创新的解决方案。

家庭智能电表的时间序列数据通常包含丰富的信息,如能源消耗模式、峰值使用时段等。这些数据通常与社会人口统计数据(如家庭大小、位置、收入水平)有关联,使得数据的特征非常复杂和多变。尽管TimeGAN是一种有效的时序数据生成模型,但其在处理具有丰富特征和复杂关联的真实世界数据时仍然可能无法生成稳定且高质量的数据。

科研目的

提出了时间序列生成模型Auxiliary Classifier Wasserstein TimeGAN with Gradient Penalty(AC-TimeGAN),在保护用户隐私的同时,实现数据价值属性的流通。相比于传统的TimeGAN模型,本文提出的模型同时通过引入Wasserstein距离和辅助分类器,提高了模型的稳定性和生成数据的质量,从而能够更好地处理和生成复杂的时间序列数据。

这种改进的模型可以更有效地处理复杂的真实世界时间序列数据。在家庭智能电表数据中,AC-TimeGAN能够模拟和生成符合实际社会人口统计特征的高质量合成数据,从而在能源需求预测、用户行为分析等方面提供洞察。

TimeGAN
AC-TimeGAN

2024-3-14组会报告摘要-02

此次汇报的内容为目前的研究内容与进展:《一种深度强化学习驱使的区块链预言机节点选择方法》,相关内容将从科研背景、科研问题、科研目的、研究内容等几个方面展开

科研背景

1.区块链与外部数据的交互是阻碍其广泛采用的主要障碍之一,因为区块链环境与外部世界隔离,为了充分利用区块链架构,需要将真实世界的数据与区块链集成.区块链预言机(blockchain oracle):是指可以访问外部数据而不影响区块链完整性的实。区块链预言机可以与外部世界通信,并将数据提取到区块链中,还能够将区块链连接到外部数据库,在区块链之外进行昂贵的计算

2.区块链提供的基本优势是去中心化。但是预言机在区块链上带来了外部数据,很难保证外部数据源的可信度。预言机的使用将中心化问题带回了区块链,重新引入了与具有单点故障的架构相关的问题。

科研问题

1.预言机可能会表现出恶意行为、由于缺乏容量无法执行任务或者由于自私未能报告其真实的可用资源。建立一个可靠的机制来选择可信的预言机对区块链网络起着重要作用

2.目前方案大多是根据预言机过去的性能记录来选择它们,没有一个智能的机制在预言机市场中选择最有价值的预言机

3.现有方法总是忽略数据请求方在请求数据时会附加的要求(数据准确性、响应时间、数据更新频率)

科研目的

1.基于声誉机制(信任管理)建立声誉系统,根据预言机的行为表现和可靠性对预言机进行声誉评分,以此来评估预言机的信任程度

2.提出基于DRL的预言机选择模型综合考虑数据请求方的需求和预言机的性能、成本与声誉,灵活智能地从预言机市场机中选择可信、经济的预言机

研究内容

基于联邦学习的隐私保护方法研究

科研背景

科研问题

电动汽车充电桩在实际使用中涉及到密集的多方数据采集、分析和应用,会产生大量的分散数据,这些数据包含了参与方的很多重要信息,我们需要保证数据的隐私和安全性。联邦学习可以在不共享原始数据的情况下进行模型训练,现有的联邦学习的框架仍然面临着数据异质性隐私泄露和通信瓶颈的挑战。

科研目的

  • 提出一种基于秘密共享和差分隐私的联邦学习的框架。
  • 使用自适应学习率和梯度的指数加权平均设计出新的联邦学习客户端个性化学习。

研究内容

实验结果

2024-03-07组会摘要01

面向智能电网网络攻击的轻量级检测方法:一种强化学习方法

科研背景

着能源需求的变化,电力系统朝着新型电力系统快速转变。越来越多的边缘设备通过多种形式接入到电网内部,增加了网架的负担,对电力物联网的可信度和可靠性提出了巨大挑战,更容易受到网络攻击。在保护数据、网络应用等免受潜在的入侵或攻击方面,成为加强新型电力系统网络安全的基本要求。

科研问题

数据的敏感性:首先,基于数据驱动的模型对训练数据集非常敏感。在真实环境中,正向和负向数据集之间的不平衡非常严重,这导致学习模型在识别某些入侵行为方面表现较差。并且建立一个好的模型是比较困难的,它需要参数数量巨大,训练耗时,比如深度学习模型。

检测的灵敏性:数据依赖的检测模型在处理具有不断变化的网络拓扑的系统时,可能无法保证其检测效果。比如,当电网网络拓扑发生变化时,相应测量数据的分布和模式也会发生变化,这对于已训练好的模型可能无法适应新的环境。另外,智能电网相比其他物联网应用更加敏感,需要一个简单且快速的检测模型。

科研目的

针对能够训练出简单、快速、高效的检测模型,采用基于无监督的强化学习(RL)方法。提出一种基于RL框架的轻量级网络攻击检测算法,使用深度强化学习(DRL)方法,其中加入自注意力机制对时序流量数据的时空信息特别“关注”,通过马尔科夫决策决(MDP )策思想检测网络攻击行为,优化决策时效质量。具体来说,我们将网络检测分为2个主要层级,一个为环境体构建层,一个为智能体检测决策层。

研究框架