2024-10-31 组会报告摘要-02

本次组会汇报常见深度学习算法在网络空间安全中的应用的综述

攻击者分类

在黑盒攻击中,攻击者对深度学习模型一无所知,对模型知识掌握度为0。

在灰盒攻击中,攻击者知道模型中存在的一些组件的细节,并且对模型有适度的了解。

在白盒攻击中,攻击者完全了解此模型。这种情况只会在最坏的情况下发生。

攻击行为分类

拒绝服务攻击(DoS):它是通过向预期的接收者发送大量流量来进行的,这样将不再被允许从相应的PC访问服务。

探测(Probing):网络被攻击者扫描,他们很容易收集信息和数据。

User to Root:攻击攻击者已经具有普通用户权限,通过利用系统中的漏洞或权限配置不当,提升到管理员权限,进而完全控制系统。

完整性攻击( Integrity Attack ):完整性攻击主要集中在更改或破坏系统上的数据。

对抗攻击(Adversarial Attacks):

在对抗性攻击中,攻击者经常插入类似于所使用的训练输入的扰动,这些攻击通常是白盒攻击。

投毒攻击(Poisoning attacks):

为了降低深度学习算法的预测准确性,对手将病毒插入训练样本中。

深度学习算法-CNN

卷积神经网络(Convolutional Neural Network ):CNN的前馈神经网络分别由卷积层、多个隐藏层、池化层和全连接层组成。卷积层的作用是特征提取,池化层的作用是对卷积层中提取的特征进行挑选,进而降维,减少计算量。

Zhang等人提出了一种基于CNN的NIDS。该模型结合了合成少数过采样技术(SMOTE)和基于高斯混合模型(GMM)的欠采样聚类。然后,设计了一个基于流的入侵检测模型SGM-CNN,该模型将不平衡类处理与卷积神经网络相结合。数据集采用的是UNSW-NB15和CICIDS2017。

深度学习算法-AE

自编码器(Autoencoder ):AE是一种无监督学习的神经网络架构,AE通过学习使得输出尽量接近输入,即最小化输入和输出之间的重构误差。

堆叠自编码器(SAE):SAE通过无监督分层学习算法将n个自编码器堆叠到n个隐藏层中,然后通过监督方法进行微调。

Liu等人提出了一种SAE与dropout相结合的多故障齿轮箱的故障诊断深度学习方法。SAEs结合dropout模型进行训练从振动信号的频谱中提取的权重矩阵。Dropout模型在这里是为了防止过拟合。

深度学习算法-DBN

深度信念网络(Deep Belief Network ):DBN是一种由多层受限玻尔兹曼机(Restricted Boltzmann Machines,RBMs)堆叠而成的深度学习模型。DBN最初由Hinton等人在2006年提出,主要用于无监督特征学习。

Zhang等人提出了一种结合流计算和深度学习的网络攻击检测方法。该方法由两部分组成:基于流计算和频繁模式的实时检测算法和基于深度信念网络和支持向量机(DBN-SVM)的分类算法。数据集采用的是CICIDS2017。

通过DBN中具有多个隐藏层的神经网络的逐层特征变换,对大量高维和非线性的未标记原始数据进行特征降维,从而得到原始数据的最佳低维表示,从而显著降低了数据的维数,即在去除冗余特征的同时保留了数据的关键重要特征,如右图所示。

深度学习算法-RNN

循环神经网络(Recurrent Neural Network)是一种适合于处理序列数据的算法。RNN的工作原理通常包括四步骤:输入、隐藏状态、输出、循环连接。经典RNN在实际应用中难以捕捉长期依赖关系,因为随着步数的增长,最开始的重要参数可能被消失,因此RNN也有一些改进架构,如长短记忆网络(LSTM)。

Le等人提出了一种基于CNN和RNN的恶意软件分类方法。在CNN卷积层之上应用LSTM,然后将循环层的输出馈送到输出层,将输入分类为九个恶意软件类别之一。采用这种方法的基本原理是,由于二进制文件中不同代码之间存在依赖关系,因此CNN层之上的循环层将有助于在将整个文件的内容馈送到输出层之前将其总结为一个特征向量。采用的数据集是Microsoft Malware Classification Challenge (BIG, 2015) 。

深度学习算法-GAN

生成对抗网络( Generative Adversal Network ):GAN是一种由两个神经网络组成的深度学习模型架构,分别称为生成器和判别器。GAN的核心思想是通过两个网络的对抗训练,使得生成器可以生成越来越真实的数据,直到难以与真实数据区分。

Hyrum等人利用GAN的概念构建了一个恶意域名生成算法,该恶意域名生成算法旨在有意绕过检测器。从GAN生成的域绕过GAN的检测器,也绕过了利用手工制作的特征的随机森林分类器。通过用这些对抗性示例来增强训练集,随机森林分类器能够以更高的效率检测训练中没有看到的域名生成算法恶意软件家族。在对抗训练中,只训练阴影层:生成模型的生成器层和判别模型的逻辑回归层。

2024-10-31 组会报告摘要-01

本次组会介绍小论文研究基于声誉的多智能体系统可信评估框架和弹性防御方法的研究进展

科研背景

基于LLM的协作互动多智能体系统的潜在威胁
•单个智能体的错误或误导性信息可以迅速传播给其他智能体,导致整个系统做出错误的决策或行为。

科研问题

由于内部错误或外部攻击,部分智能体的行为可能对基于大语言模型的多智能体系统的效率和安全性产生显著影响。因此,如何有效评估整个智能体的可信度,并缓解系统错误的决策或行为,是亟需解决的问题。

科研目的

提出一种基于声誉的多智能体系统的可信评估框架,根据智能体的行为与认知,自动化的、可量化的评估智能体的可信度;设计弹性扰动的防御策略实现保持智能体性能的同时缓解其安全风险。

研究方法

使用主观逻辑量化方法,评估智能体的行为和认识,得到智能体的声誉值,根据声誉值高低提供自适应的系统提示扰动,缓解对多智能体系统的越狱攻击或特征攻击。

实验结果

2024-10-24组会摘要01

科研背景

随着分布式能源 (Distributed Energy Resource,DER) 单元的不断接入,传统配电网的单向电力传输方式正逐渐向主动配电网的双向电力传输方式转变,这种转变对配电网的感知、控制和协调能力提出了更高的要求。
单个DER额定容量很少,但是其渗透性在不断提高。为减小风电和太阳能光伏等DER单元间隙性发电对用户侧电能质量的影响,配电网给众多馈线支路安装大量的智能电子设备 (IED)和远程终端单元(RTU) 对DER运行状况进行实时监测感知。一旦攻击者入侵至配电网通信网络,并利用恶意漏洞控制DER 单元,可能造成发电节点失效和大规模停电事件,产生不可估量的经济损失,甚至对人员造成伤亡.

科研问题

1.基于模型的检测方法,易被攻击者识破:基于模型的被动式方法十分依赖于准确的模型知识如配电网网络拓扑和线路参数等。一旦攻击者了解了防护方法的工作原理,且得到了这些静态信息,将极有可能使得基于模型的被动式方法失效

2.基于数据的检测方法,忽略了电气系统的物理拓扑结构。电力系统的不规则拓扑结构已被建模为图形,每个网格总线和分支分别直观地抽象为顶点(节点)和边。而在数据驱动的检测方法中,往往忽略这种拓扑结构,利用这种利用电网的底层图结构来提高检测性能是可行的。

科研目的

1.根据DERs系统物理结构信息,我们提出一个图表示学习方法,这种方法能够捕获新的结构状态信息,从而提高检测效率。
2.根据物理—信息这种复杂动态系统,采用马尔可夫决策流程 (MDP) 来有效地对网络攻击行为进行建模,并通过与从少量观察到的数据中得出的最佳奖励,自主探索内在的攻击意图,提高检测效果。

2024-10-24组会摘要02

科研背景

图神经网络(GNNs)在各种基于图的机器学习任务(如节点分类、链接预测和图分类)中对关系数据的学习已经取得了最先进的性能。由于其优越的性能,GNNs现在广泛地被推荐系统、药物发现和医疗诊断等多种应用所采用。但它们并不能直接适用于具有局部分布图的现实世界系统,在这些系统中,来自不同来源的图不会在参与者之间共享,这导致了训练GNNs的联邦学习。

科研问题

科研目的

科研内容

2024-10-17组会摘要04

研究背景

机械故障诊断在现代工业中具有极其重要的地位和作用,它被广泛应用于各种领域,包括人造卫星、风力涡轮机和机械工程等。旋转机械作为工业设备的核心组成部分,其可靠性直接影响着能源消耗、维护成本和人类安全。

然而,旋转机械经常在恶劣的工作环境下运转,从而增加了机械故障的发生率,给企业带来了巨大的经济损失。因此,研究机械故障诊断技术具有极其重要的社会和经济意义。

从实际机械设备获取故障数据非常艰难,带标签的故障数据更是珍贵,利用已有故障数据进行外延性故障诊断分析势在必行。

研究问题

1旋转机械故障迁移诊断模型特征表达能力不足,诊断精度较低

2 现有的机械智能故障诊断方法通常假设训练和测试数据的分布一致,并且需要大量标注数据。然而,在不同工况下,数据分布会发生变化,同时获取足够的标签数据往往成本高且耗时长。

3 无监督多源域自适应近年来得到了深入研究,它为在目标数据集上没有标记的情况下处理故障诊断任务提供了一种很有前途的方法。大多数方法旨在学习共同特征空间中所有域的域不变特征。然而,处理涉及多源域之间相对较大偏移的情况具有挑战性。

研究目的

1 提出一种基于多视角卷积神经网络特征融合的机械故障迁移诊断方法,该方法可以增强卷积神经网络的特征表达能力,提高故障迁移诊断精度。

2 提出一种基于多表示混合卷积神经网络的无监督机械故障诊断方法,该方法可以提高单源域的故障迁移准确率,解决跨工况故障诊断问题。

3 提出一种基于全阈值残差网络的多源域自适应机械故障诊断方法,它能在特定的域特征空间中学习源域和目标域的特定域不变特征,该方法可以提高多源域的故障迁移准确率,进一步解决无监督跨工况故障诊断问题。

研究内容

研究计划

10.17-10.31 设计度量函数

11.01-11.14 完善仿真

11.15-11.22 完善论文(100%完成)

2024-10-17组会摘要01

科研背景

联邦学习对模型训练与整体数据的需求进行解耦(各方独自训练),这样做一方面能够保护用户隐私,另一方面攻击方想要获得数据只能攻击各个用户,而不能直接攻击中心服务器(中心服务器没有用户的数据)。

科研问题

科研目的

科研内容

2024.10.10 组会摘要2

研究背景

Ø社交媒体内容丰富多样,随着多媒体技术的发展,独立媒体和专业媒体开始向以图片、文字和短视频为主的多媒体信息形式转变。多媒体内容包含更丰富和更直观的信息,能更好更及时的报道时事新闻,消息也更容易被传播。

Ø社交媒体平台在现代社会新闻报道和信息传播中起到关键作用。然而,在社交媒体为用户提供了海量的信息内容的同时,媒体平台没有解决虚假信息问题。社交媒体平台的开放性也会导致谣言无限制的传播。

Ø互联网信息量大,信息的质量参差不齐,形式多种多样,普通人难以辨别数据真实性,对于具有诱导性的推文容易引起跟风转发行为,导致谣言迅速传播。

科研问题

一些最近基于深度学习的谣言检测方法通过谣言扩散的完整阶段来表示谣言,并尝试从中学习结构信息。然而,这些方法局限于将谣言传播表示为静态图,这对于捕捉谣言的动态信息并不理想。

传统图神经网络通过消息传递的机制更新节点特征。受限于网络结构和大小,对于与根节点距离较远的节点特征对于根节点特征的更新过程影响占比较小,但这往往是不可忽视的一部分。

科研目的

基于谣言在社交网络传播过程构造动态传播图,根据不同图快照类型和数量学习传播图表示并运用于下游任务。

基于谣言传播过程提取谣言的序列信息,提取谣言序列包含的时空特征,捕捉长短距离依赖关系,并与动态传播特征融合,完成谣言检测任务

研究内容

2024.9.26-组会摘要02

我本次汇报的题目是《面向非侵入式负载监测的对抗攻击与防御技术研究》,我将从以下几个方面进行讲述。

背景及意义

为了提高NILM负荷分解的准确性和泛化能力,近年来,深度学习在NILM中的研究日益广泛;与此同时,新型电力系统的快速发展使使恶意攻击者从物理上可接触的对象增多、可攻击路径增加。
NILM系统在面对攻击者精心构造的对抗样本时具有极大的脆弱性,影响新型电力系统的稳定性和经济性。

科研问题

常用的对抗攻击方法生成的对抗样本存在攻击效果、时间效率和扰动程度不能有效平衡的问题。如何在保证攻击效果的同时降低时间效率和扰动程度是一个关键问题。
现有的对抗防御方法存在计算开销大、效率低的问题,对于实时系统或资源受限的设备不友好;而且,一些防御方法过度依赖已知的对抗样本,会限制防御方法的泛化能力和实用性。

科研目的

提出面向NILM的电力时序数据对抗样本生成方法

提出面向NILM的电力时序数据对抗防御方法

研究内容

NILM的脆弱性分析

面向NILM的对抗样本生成方法

面向NILM的对抗防御方法

计划

完善防御实验细节
完成对比实验,修改小论文

2024-9-19-组会摘要02

绪论-研究背景及意义

新型电力系统具有大量智能终端接入、高新能源供能占比、信息物理高度融合等特点,在促进能源系统低碳化、智能化的同时,也给新型电力系统的安全稳定运行带来了诸多问题。

针对这一背景,需要对智能终端的安全性进行深入研究,为新型电力系统提供更加全面和有效的安全性检测方法。

研究内容与方法

根据新型电力系统中智能终端低功耗、低计算能力的特点,提出了一种更加适应于智能终端的安全接入检测方案 。

通过深度学习方法对电力系统中的大量数据进行高效学习和分析,从而实现对电力系统的智能终端安全性的有效检测。实现故障诊断、设备状态监测和安全风险预警等。

终端接入认证机制的整体架构是通过生成唯一的终端设备指纹和密钥,以及使用这些信息在接入认证阶段中进行身份验证和加密通信,从而确保设备的安全接入和通信。

2024-9-19 组会摘要3

研究内容1-一种基于时空图神经网络的全国XCO2高分辨率时空分布增强方法

本研究中所使用的多源卫星遥感数据包括OCO-2、OCO-3及GOSAT的卫星检索XCO2数据集。OCO-2是美国国家航空航天局(NASA)发射的第一颗专门用于监测大气CO2的卫星。OCO-2卫星同时监测大气在3个波长的吸收光谱,第1个用于获取云和气溶胶覆盖信息,后2个用于获取CO2柱浓度。OCO-2采用ACOS v10r Lite算法对XCO2数据进行偏差矫正和数据质量标记。OCO-3是NASA喷气动力实验室设计用于测量大气CO2的装置,OCO-3是用OCO-2备用设备建造的,因此它的基本性能和OCO-2类似,但是它可以对特定的区域进行监测。GOSAT是全球第一颗用于监测主要温室气体(CO2和甲烷(CH4))的卫星,虽然GOSTA卫星空间分辨率不如OCO-2和OCO-3,但是其时间分辨率较高,可以更好地捕捉CO2的时间变化趋势。

研究内容2-一种基于wrf-co2的全国碳排放预测模型

WRF-CHEM 模式是 NOAA/ESRL(National Oceanic and AtmosphCCic Administration/Earth System ReseaCNh Laboratory)开发的新一代区域空气质量模式,具有完全在线的气象和化学耦合模式。该模型中,气象模块(辐射、微物理、积云过程、边界层等)为化学模块(排放源、干沉积、气象化学、云化学、气溶胶化学等)提供气象场,化学模块将各物理-化学过程对气象参数的影响反馈到气象场,两者相互作用。

       而wrf-co2该系统是在天气研究和预报(WRF)模拟系统的基础上开发的,该系统包括与化学耦合(WRF-CHEM)、切线和伴随代码(WRFPLUS)和数据同化(WRFDA)的系统,敏感性试验和反模拟试验结果表明,WRF-CO2 4D-Var在区域CO2反演中具有潜在的应用价值。

研究内容3-一种有效的全国2050碳中和的能源规划方案

估计了光伏和风力发电系统的LCOE,以表明发电的电网平价,其定义为光伏和风力发电厂生命周期内所有投资、运行和维护成本与投资成本的比率、土地征用、输电和储能成本的归一化净现值。解决基于LCOE的成本最小化问题。

根据各部门电力负荷的灵活性,预测了2060年的每小时电力需求。首先,在2018年按31个省份的农业、工业、交通运输、建筑、服务和家用电器等六个非电力行业在2060年的预测发电率(58%)下的总电力需求增长。

然后预测了房屋供暖和制冷的每小时电力负荷。通过获得中国各地区房屋空间供暖和制冷所用的每小时能源。根据气候变暖的预测温度,预测了2021 – 2060年31个省份的每小时供暖和制冷电力需求。电力需求在白天转移,以匹配每小时光伏和风力发电的峰值。

采用1 × 3 𝑘𝑚^2的像素分辨率来安装光伏电池板或风力涡轮机,这样在优化模型中预测单个光伏和风力发电厂的位置和容量。并通过使用OpenStreetMap中最接近预计光伏或风力发电厂的已投产光伏和风力发电厂的位置和容量来评估预测,验证尚未建成的预计光伏或风力发电厂的位置和容量。

主要估算2060年新的光伏和风力发电厂产生的电力流中包含的资金对收入再分配的影响。首先,根据2015年全国调查得出的城乡居民收入的频率分布,估算了县级人口的收入分布。最后根据2060年碳价格从0美元/吨CO2上升到100美元/吨CO2时,2,373个县每个人口组的收入和人口比例的变化,使用公式估算了中国的收入基尼系数。