神经网络后门攻击

科研背景

近年来,以深度学习为代表的人工智能技术飞速发展,在图像分类、自然语言处理等多个任务中超过了人类表现。然而,在这一过程中人工智能系统自身暴露出众多安全问题,不断涌现出针对人工智能系统的新型安全攻击,包括对抗攻击、投毒攻击、后门攻击、模型逆向击、成员推理攻击等.这些攻击损害了人工智能数据、算法和系统的机密性、完整性和可用性,因此人工智能安全受到了人们的广泛关注。

人工智能安全攻击主要有三个方面数据攻击、算法攻击、模型攻击。所对应的防御机制在模型和算法方面,建立后门攻击和逆向攻击的底层技术防御机制,提升可解释性、透明性和鲁棒性的能力;在数据和隐私安全方面:提升训练数据质量及评估水平,加强防范数据投毒和对抗样本攻击的技术能力,建立机器学习等技术的隐私计算体系。深度学习中常见的几种攻击类型,由于深度学习的黑盒性质、模型复杂性、可解释性不足等原因,它容易受到多种攻击,大致可以将这些攻击归纳为:对抗样本、通用对抗补丁、数据投毒、后门攻击等。不同的攻击在深度学习的不同阶段进行攻击:对抗样本和通用对抗补丁(UAP)仅影响模型部署后的推理阶段;数据中毒是在数据收集或准备阶段进行;后门攻击可以在ML管道的每个阶段进行(模型测试阶段除外)。

科研意向

结合目前我所阅读的文献,我认为接下来的研究课题可以尝试从如下几个方面考虑:1.触发器设计: 目前触发器的研究主要针对其大小、形状、位置以及不可见性, 而针对其潜在特征表示的深入研究较少,因此如何更好的设计触发器将是未来研究可以考虑的方向。2.更多应用: 后门攻击作为一种方法, 不仅仅是产生安全威胁, 也可以在其他方向上发挥作用。目前已经出现了一些有益应用如自动驾驶、人脸识别等, 但仍然还存在很多针对不同领域的潜在应用。3.可解释性: 目前后门攻击仅依据实验效果, 而没有完整有效的理论支撑, 什么样的模型更容易嵌入后门, 什么样的触发器更容易被模型学习, 可以对相关的可解释性进行讨论与分析。

研究内容

基于多方安全计算和差分隐私的联邦学习方案

科研背景

近年来,随着隐私保护及数据安全法律法规的逐渐完善,数据孤岛问题变的日益严峻。数据孤岛,因为现在各行各业的数据都被不同的机构企业所拥有。比如政府银行医院他们所拥有的数据的维度类型差异很大,但实际上这些数据不能够给到彼此,无论站在合规的角度还是资产保护的角度,特别是越有价值的数据。越有价值的数据往往越不能够流动出去。数据不能溜出去,数据的价值可以溜出去, 只有数据的价值溜出去了才能变现,掌握有价值的数据才能变成价值,这中间存在一种矛盾。

隐私计算是“数据可用但不可见”技术的集合,包括FL,安全多方计算(MPC),可信执行环境(TEE),差分隐私(DP)等。其中,FL是一种将分发机器学习与隐私技术相结合的衍生技术他们往往比较高效,但是做不到可证安全,大家觉得它可以保护隐私,但是保护的程度是多少,不能去保证。Zhu L , Liu Z 等人工作指出,联邦学习中恶意参与方或服务器可以通过客户端本地模型更新中推测出客户端本地数据的属性以及时候存在某条数据等隐私信息(属性推理攻击,成员推理攻击,模型反演攻击等等)。

研究现状

大多数的FL+DP的方案都是采用的LDP(Locally Differential Private Federated)加噪,但是这样程度的噪声的累积对全局模型影响很大,当ϵ比较小的时候,准确度会降低。

科研目的

本文将差分隐私和多方安全计算相结合,提供了一种新的解决思路,用户不再对本地训练得到的本地模型添加扰动,首先将本地模型秘密共享至多个服务器,把LDP转变为多个CDP。保护隐私不被泄露的同时最大限度减少精度损失。

研究内容

系统框架

2023-08-17组会摘要03

本次汇报对开题报告内容《基于联邦学习的分布式异常检测方法研究》进行介绍,主要从研究背景与意义、研究现状、研究方案、研究内容、研究计划几个方面展开。

研究背景与意义:

随着我国居民人口数不断增多,电网规模的不断提升、线路复杂度的迅速增加,给我国电网提出了新的要求。智能电网中信息技术、通信技术、计算机技术的引入大大提高了电网效率、也是电网面临着传统电网不曾考虑过的风险,也就是计算机网络安全问题。智能电网中出现的问题可以通过分析智能电表或传感器收集的数据、检测电网中的异常来识别。与此同时,我国智能电网朝着通过分布式新能源系统来实现并网消纳的方向发展。这就需要我们考虑到分布式的电网异常检测问题。

对于传统的分布式系统,在需要考虑隐私的应用程序中,数据的传输可能会被完全禁止,从而无法创建模型。而联邦学习方法训练在数据位置执行,从而保持数据隐私。但是随着深度神经网络的发展,模型变得非常复杂,每一轮迭代中变化的模型参数也大大增加,联邦学习在每一轮训练的过程中需要将这些参数上传和下发,这相较于传统的机器学习会增加巨大的通信开销。而且在整个培训过程中更新和传达的模型信息可能会暴露出用户的敏感信息。

研究现状

目前时序数据异常检测模型发展迅速,主要分为两类,a) 针对正常数据进行训练建模,然后通过高重构误差来识别异常点,即生成式的算法,往往是无监督的。b)通过标注数据,告诉模型正常数据点长什么样,异常数据点长什么样,然后通过有监督算法训练分类模型,也称判别式算法。

在解决联邦学习通信效率方面,客户端选择、模型压缩、客户端分层、降低模型更新频率这几方面着手,而在联邦学习隐私保护方面秘密共享机制、差分隐私、同态加密都取得了不错的效果。

研究方案:

我的研究将从以下几个方面展开:分布式异常检测模型的建立,联邦学习的通信优化、联邦学习的隐私保护。

研究内容:

图1 低比特量化的联邦异常检测模型流程

2023-07-27组会摘要03

本次组会对近期的工作《基于深度强化学习的大规模云计算任务调度》的研究进度进行汇报,主要从科研背景、科研问题、科研目的以及研究进展这几方面来阐述。

科研背景

  1. 云计算:一种可以为用户按需提供计算资源的服务平台,拥有着高计算能力、低服务成本、高可伸缩性和可用性等优势。近年来,云服务吸引了很多终端用户包括企业、个人以及物联网应用等,他们都希望以低成本实现计算和功耗应用程序。
  2. 作业调度:在云计算中一个核心的研究问题就是作业调度问题,作业调度的好坏直接影响着云平台的服务质量。一个好的作业调度方法不仅能够为用户提供更好的服务质量,还能增大服务提供商的利润空间。

科研问题

随着云计算市场的快速发展,云服务平台在作业调度方面存在以下挑战:
1. 复杂的作业请求和高度动态变化的云环境给实时调度带来很大的挑战,很难找到一种最优的调度方法来保证最优的服务和最小的资源浪费。
2. 大规模云环境中,用户对服务的响应时间提出了更高的要求,总是希望在更短时间内得到响应,而传统单智能体在大规模环境中的响应效率较差。

科研目的

提出一种面向大规模复杂云环境的分层在线任务调度方法,使用深度强化学习(DRL)方法,通过分级分层的思想处理大规模的操作空间,优化决策质量。具体来说,我们将云环境分为集群和虚拟机两个层次,并在每一层专门设置不同的智能体学习决策。特定的智能体不仅比一个组合的大型智能体更快地调度任务,而且由于一个DQN只负责一个小环境中的操作,因此更能提高决策质量,快速响应用户请求,在保证用户响应时间的基础上,提高资源利用率,降低执行成本。

系统框架

图1 大规模云作业调度的整体框架

研究进展:补充实验完成多智能体在线分层调度算法,取得进一步的实验结果。

2023年7月27日 组会报告摘要-01

本次汇报对分布式储能网络化运营能量需求预测研究的研究进展进行介绍,主要从科研背景、科研问题、科研目的、研究进展几个方面展开。

科研背景:

分布式储能是一种容量小且普遍靠近于负荷端的储能配置形式,常应用于中低压配电网及智能微电网中。相较于集中式储能,分布式储能安装地点灵活、投资费用低, 功率介于几千瓦至几兆瓦之间,持续放电时间较短,且容量一般不大于10 MW ·h。

分布式储能物理形态多样,包括新能源电厂储能、社区储能、电动车储能、数据中心储能、家庭储能、移动式储能等 。
储能是新能源发电并网和消纳的重要支撑技术,其重要作用包括平抑功率波动、削峰填谷、改善电能质量等。

预测性能源管理系统(PEMS)技术依赖于对未来需求/负荷和能源产生的准确预测。

科研问题:目前对于负荷预测模型,提取更精确的负荷的序列特征表示的能力有限,预测的准确性和泛化能力有所欠缺。
同一区域多个负荷对象间存在相关性,使用传统的单任务学习方法未考虑多个地点的负荷间的潜在关系,忽视这之间的关联信息可能会导致学习效果欠佳。

科研目的:结合多储能单元历史数据,通过季节性分解的对比学习获得好的特征表示,接着通过多任务学习挖掘不同单元的相关性,对负荷进行预测,最后通过预测结果进行能量管理以降低微电网群运行成本。

研究框架:

2023年7月27日 组会报告摘要-02

基于网络空间测绘技术面向区块链的P2P网络资产探测研究

科研背景

网络空间测绘是一种技术,可以帮助我们理解并管理复杂的网络环境。它涉及收集网络中的数据,并以有组织和可视化的方式表示这些数据。网络空间测绘技术可以用于诸如网络发现、资产管理、安全分析等任务。

随着网络的不断发展以及用户对网络使用需求的急剧增长,网络规模不断扩大、网络空间趋于复杂。通过网络空间资产探测,可以及时发现潜在的安全风险,避免被不法之徒攻击。国家把网络空间安全概念已提升到一个重要的层次,更加显示了网络空间安全。在网络攻防对抗中,首先得了解网络,要了解网络空间,就需要对网络空间进行资产探测。

网络空间资产探测技术作为网络安全的重要基础技术,是通过主动或被动探测的方法,来绘制网络空间上设备的网络节点和网络连接关系图,为网络设备进行画像。

以太坊是一种开源的区块链平台,以其智能合约功能和自定义的加密货币以太币闻名。它在加密货币社区中有着广泛的应用和影响力。然而,以太坊的P2P网络结构使得它变得相对难以追踪和监控。P2P网络,或点对点网络,是一种网络模型,其中所有参与者都被视为等同的节点,没有中央服务器或管理体。这种分布式网络架构使得以太坊在效率和抗审查性上都有一定的优势,但同时也对网络安全性和网络资产管理带来了挑战

由于以太坊网络的特性和价值,对其进行网络空间测绘以进行资产探测是很有意义的研究领域。通过这种技术,我们可以更好地了解以太坊网络的结构和行为模式,发现可能的安全风险,以及找到提高网络效率的方法。此外,它还可以为网络管理员和参与者提供重要的工具,以更有效地管理和利用他们的网络资产。

科研问题

以太坊P2P网络中的资产可以用哪些参数和指标来描述,并如何探测?需要明确哪些参数和指标可以用来描述以太坊网络中的资产。例如网络节点数量、分布、类型、状态等以及账户数量、类型、状态等。

通过网络空间测绘技术检测到哪些安全事件?使用网络空间测绘技术进行资产探测可能会揭示一些潜在的安全风险,例如可能被攻击的网络节点。
网络层:Eclipse攻击检测
应用层:钓鱼诈骗检测

研究内容

实验结果

2023年7月20日 组会报告摘要-03

这次组会主要介绍《基于DDQN的区块链网络攻击建模》研究进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景

  • 随着区块链技术的发展与不断应用,许多涉及生产生活的服务使用区块链作为数据存储使用,这其中包含大量大型组织以及政务系统。同时,区块链相关发展规划也写入“十四五”规划之中,应用前景广阔。区块链作为一种分布式存储系统,具有去中心化等特点,因此出现了大量跨网络部署的应用场景。然而,区块链系统由于涉及大量关键数据的存储,较容易遭APT攻击。
  • 其中,Fabric作为联盟链的代表,由于其智能合约存在由于外部访问引发的命令执行风险,APT攻击者可以利用一些漏洞获取组织的MSP,利用Chaincode可嵌入攻击的特性,对整个联盟链网络进行APT攻击,构建一条可靠的稳定通信信道,达到长期隐蔽的获取价值数据的目的,实现APT攻击。
  • 深度强化学习通常用于解决决策问题,利用其进行网络攻击建模,可以模拟攻击者的行为,并预测可能的攻击路径和目标。有助于了解攻击者的行为模式,及时发现潜在的威胁,并采取相应的防御措施来保护网络安全。
  • (Double Deep Q-Network)作为一种深度强化学习算法,通过解决DQN中的过估计问题,提高了收敛速度和稳定性,提高了决策的准确性,能够更好地处理高维状态空间,进一步改进了DQN算法的性能,适合于区块链这种较为复杂的环境

科研问题

  • 关于区块链系统的安全性研究,主要针对信息安全传输方面研究居多,针对面向区块链的APT攻击研究较少。
  • 建模方法往往依赖于专家知识和规则的手动定义,受到个人主观意见和经验的影响,存在一定的局限性,导致模型无法全面覆盖各种攻击情况和变化,并且需要大量的时间和资源

科研目的

提出一种基于深度学习的区块链系统APT攻击图生成方法。将APT攻击路径生成建模为智能体通过与环境交互来学习最优行为策略的问题,深度强化学习可以通过学习和模拟攻击者的行为,更加准确高效的生成攻击路径,帮助区块链系统更好地应对复杂的APT攻击。

研究内容

实验结果

2023-07-20组会摘要02

科研背景
云计算是一种通过网络向用户提供计算资源、平台、应用程序的分布式计算框架,是一种可以为用户提供一种按需使用、无处不在、便捷的共享计算资源,这些计算资源包括但不限于网络,服务器,存储,应用程序和服务。同时这些计算资源可以快速扩展和释放,使用户的管理成本大大降低。根据提供服务的不同,云计算的服务形式可以分为基础设施及服务,平台及服务,软件及服务三种类型。在基础设施即服务这种服务形式中,云服务供应商,比如亚马逊EC2,阿里云,他们通过虚拟机化技术为用户提供了具有不同配置多种类型的服务实例。用户可以根据自身需求自由的选择服务实例,并且可以根据需求变化对服务实例进行弹性拓展和释放,减少了计算资源的浪费,相比于传统计算环境具有更高的性价比。
工作流的定义是业务过程的部分或整体在计算机应用环境下的自动化,是对工作流程及其各操作步骤之间业务规则的抽象、概括描述。通俗的将,工作流是一组具有数据或功能依赖的任务组成的作业,根据应用场景可以分为将业务过程抽象成任务自动化完成的计算模型的业务工作流,主要存在于自动化办公这类事务密集型场所;有数据依赖性的复杂的科学数据处理活动的集合科学工作流,主要用于地震预测,图像识别这类计算密集型场景。近几年科学工作流已经由小规模、单一领域、单一组织发展成为大规模多学科交叉的科学计算问题,计算量更加庞大且性能要求高,开始普遍使用云计算支持其处理过程。

科研问题
1.工作流内部任务间的依赖关系使其调度是NP-hard问题,调度需要考虑子任务的执行顺序和计算实例。
2.云计算的动态性、异构性、扩展性使云计算环境下的工作流调度问题成为NP-complete问题,云服务实例类型不同、可动态租赁和释放、计算和数据传输性能动态变化影响调度算法性能。
3.实时调度需要满足截止时间约束、成本、能耗等特定的服务质量要求。

科研目地
针对云环境的动态性、异构型、扩展性等特性,提出一种面向不确定云环境的实时云工作流调度方法,通过深度强化学习(DRL)智能体,将实时到达的具有截止时间期限的工作流调度到任务执行情况不确定的云环境中执行。具体来说,在每个工作流到达时,根据工作流结构特征将子任务进行拆分为可直接调度执行的就绪任务和需要等待前置任务完成的等待任务,并为每个子任务分配子截至时间约束,不断将就绪任务通过DQN智能体调度到云虚拟机中执行,并根据任务执行情况更新未调度任务的子截至时间约束,通过智能体不断离线学习调度经验,在虚拟机子任务执行时间和数据传输时间不确定的云环境中实现低响应时间、低成本的工作流调度。

研究框架