2024-10-31 组会报告摘要-02

本次组会汇报常见深度学习算法在网络空间安全中的应用的综述

攻击者分类

在黑盒攻击中,攻击者对深度学习模型一无所知,对模型知识掌握度为0。

在灰盒攻击中,攻击者知道模型中存在的一些组件的细节,并且对模型有适度的了解。

在白盒攻击中,攻击者完全了解此模型。这种情况只会在最坏的情况下发生。

攻击行为分类

拒绝服务攻击(DoS):它是通过向预期的接收者发送大量流量来进行的,这样将不再被允许从相应的PC访问服务。

探测(Probing):网络被攻击者扫描,他们很容易收集信息和数据。

User to Root:攻击攻击者已经具有普通用户权限,通过利用系统中的漏洞或权限配置不当,提升到管理员权限,进而完全控制系统。

完整性攻击( Integrity Attack ):完整性攻击主要集中在更改或破坏系统上的数据。

对抗攻击(Adversarial Attacks):

在对抗性攻击中,攻击者经常插入类似于所使用的训练输入的扰动,这些攻击通常是白盒攻击。

投毒攻击(Poisoning attacks):

为了降低深度学习算法的预测准确性,对手将病毒插入训练样本中。

深度学习算法-CNN

卷积神经网络(Convolutional Neural Network ):CNN的前馈神经网络分别由卷积层、多个隐藏层、池化层和全连接层组成。卷积层的作用是特征提取,池化层的作用是对卷积层中提取的特征进行挑选,进而降维,减少计算量。

Zhang等人提出了一种基于CNN的NIDS。该模型结合了合成少数过采样技术(SMOTE)和基于高斯混合模型(GMM)的欠采样聚类。然后,设计了一个基于流的入侵检测模型SGM-CNN,该模型将不平衡类处理与卷积神经网络相结合。数据集采用的是UNSW-NB15和CICIDS2017。

深度学习算法-AE

自编码器(Autoencoder ):AE是一种无监督学习的神经网络架构,AE通过学习使得输出尽量接近输入,即最小化输入和输出之间的重构误差。

堆叠自编码器(SAE):SAE通过无监督分层学习算法将n个自编码器堆叠到n个隐藏层中,然后通过监督方法进行微调。

Liu等人提出了一种SAE与dropout相结合的多故障齿轮箱的故障诊断深度学习方法。SAEs结合dropout模型进行训练从振动信号的频谱中提取的权重矩阵。Dropout模型在这里是为了防止过拟合。

深度学习算法-DBN

深度信念网络(Deep Belief Network ):DBN是一种由多层受限玻尔兹曼机(Restricted Boltzmann Machines,RBMs)堆叠而成的深度学习模型。DBN最初由Hinton等人在2006年提出,主要用于无监督特征学习。

Zhang等人提出了一种结合流计算和深度学习的网络攻击检测方法。该方法由两部分组成:基于流计算和频繁模式的实时检测算法和基于深度信念网络和支持向量机(DBN-SVM)的分类算法。数据集采用的是CICIDS2017。

通过DBN中具有多个隐藏层的神经网络的逐层特征变换,对大量高维和非线性的未标记原始数据进行特征降维,从而得到原始数据的最佳低维表示,从而显著降低了数据的维数,即在去除冗余特征的同时保留了数据的关键重要特征,如右图所示。

深度学习算法-RNN

循环神经网络(Recurrent Neural Network)是一种适合于处理序列数据的算法。RNN的工作原理通常包括四步骤:输入、隐藏状态、输出、循环连接。经典RNN在实际应用中难以捕捉长期依赖关系,因为随着步数的增长,最开始的重要参数可能被消失,因此RNN也有一些改进架构,如长短记忆网络(LSTM)。

Le等人提出了一种基于CNN和RNN的恶意软件分类方法。在CNN卷积层之上应用LSTM,然后将循环层的输出馈送到输出层,将输入分类为九个恶意软件类别之一。采用这种方法的基本原理是,由于二进制文件中不同代码之间存在依赖关系,因此CNN层之上的循环层将有助于在将整个文件的内容馈送到输出层之前将其总结为一个特征向量。采用的数据集是Microsoft Malware Classification Challenge (BIG, 2015) 。

深度学习算法-GAN

生成对抗网络( Generative Adversal Network ):GAN是一种由两个神经网络组成的深度学习模型架构,分别称为生成器和判别器。GAN的核心思想是通过两个网络的对抗训练,使得生成器可以生成越来越真实的数据,直到难以与真实数据区分。

Hyrum等人利用GAN的概念构建了一个恶意域名生成算法,该恶意域名生成算法旨在有意绕过检测器。从GAN生成的域绕过GAN的检测器,也绕过了利用手工制作的特征的随机森林分类器。通过用这些对抗性示例来增强训练集,随机森林分类器能够以更高的效率检测训练中没有看到的域名生成算法恶意软件家族。在对抗训练中,只训练阴影层:生成模型的生成器层和判别模型的逻辑回归层。