2022-06-02 组会报告摘要-02

本次介绍的是自己对于基于联邦学习的异常流量检测的一些想法。

一、科研背景

随着网络技术的快速发展,各式各样的新型恶意攻击不断出现。网络异常流量检测是抵御恶意攻击、保护网络可用性和隐私安全的重要手段,对于维护网络安全有着至关重要的作用;
利用深度学习进行异常检测引起了广泛的研究,性能较好的深度学习模型的建立需要大量的数据样本。然而单一网络域内面临着数据不足、标注能力不够、且原始流量数据可能泄露域内的敏感信息和用户数据,因此难以训练出性能较好的异常检测模型。

传统的集中式模型训练方法需要用户将数据上传到服务器中,在服务器端实现数据收集、存储、模型训练,无法保证用户的数据隐私。联邦学习作为一种新的、隐私安全的机器学习框架,可以在各方不汇聚隐私数据的基础上共同训练模型。

二、科研问题

1、异常流量数据样本少,传统的集中式学习易造成用户隐私泄露。
2、参与联邦学习的用户数据量不平衡,容易造成较大的隐私预算。

三、科研目的

1、利用联邦学习框架解决网络流量样本少的问题;
2、针对客户端之间的不平衡数据,利用一种基于差分隐私的联邦学习(DP-FL)框架,设计了一种新颖的差分隐私卷积神经网络,采用自适应梯度下降(DPAGD-CNN)方法对新对每个用户的模型参数进行更新,提高隐私保护的性能。

四、研究内容

1、总体框架图

2、用户模型参数更新:

3、全局模型更新

2022-06-02 组会报告摘要-01

本次组会将介绍个人近期实施的一次成员推理攻击案例,通过这个真实的案例推导出差分隐私的公式;并进一步将介绍差分隐私应用到分布式GAN训练中遇到的一系列问题以及目前的解决方案。

内容主要包括:1.针对kaggle比赛的一次成功成员推理的案例,2.由思考如何应对这种攻击而推导出我们的差分隐私公式,3.将差分隐私机制加入到分布式GANs训练的方案,4. 针对原始数据与加入差分隐私后的合成数据D’之间,隐私损失评估方案落地过程中遇到的一系列实际困难和解决方案。

通过本次组会介绍,我们希望大家能有如下一些收获

1.知道什么是成员推理攻击,何种情况下可以实施这种攻击

2.通过应对成员推理攻击,理解什么是差分隐私机制,能够自己推导出差分隐私公式

3.一个现实的数据集的表示方式(经验累积概率分布函数ECDF),它为何无法使用通用的理论分布形式表示(即为何无法用累积概率分布函数CDF,和概率密度函数PDF)

4.如何比较两个数据集之间的差异,J-S散度为什么可用以及它的局限性

5.解决原始数据集D和生成数据集D’的隐私损失评估方案可行性的直观表达

6.如何将数据集的表示、数据集之间的差异性比较从点数据迁移到高维数据

2022-5-26 组会报告摘要-03

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究进度,主要内容如下

科研背景
近年来,云计算技术迅速发展,云服务供应商除了为用户提供强大的计算和存储资源,越来越多的功能如负载平衡,自动拓展等功能为应用开发提供了强有力的支持,使得云服务逐渐成为搭建应用程序的主流选择之一。随着越来越多的应用选择云环境,云服务调度的任务种类愈发复杂,同时,各类在线服务应用对云环境高效实时的任务调度需求不断增加。

科研问题:
如何实现云环境下对复杂任务的实时,高效,提供满足用户QoS要求的调度。

科研目的:
使用遗传算法和深度强化学习,通过遗传算法对workflow任务在虚拟机中子任务执行顺序的预处理,深度强化学习Q-learning算法进行智能调度,实现对workflow任务实时调度,并尽可能降低任务响应时间和虚拟机成本满足QoS要求。

整体框架:

2022-5-26 组会报告摘要-02

本次组会主要是对最近的论文复现以及改进的实验进度进行汇报,其主要内容如下:

【背景】

区块链作为核心技术自主创新重要突破口,加快推动区块链技术和产业创新发展。要加强对区块链技术的引导和规范,加强对区块链安全风险的研究和分析,密切跟踪发展动态,积极探索发展规律

随着区块链技术的快速发展,各种类型的网络犯罪层出不穷,以太坊已成为各种网络犯罪的温床。由于区块链的匿名性,犯罪分子试图通过向区块链系统注入资金来逃避监管和从事非法活动。据报道,以太坊遭遇了各种各样的诈骗,如黑客、网络钓鱼和庞氏骗局等。

【科研问题】

【科研目的】

设计一种基于时间加权多通道游走的区块链交易异常检测方法。

【整体框架】

【论文复现】

2022-5-19 组会报告摘要-02

科研背景:随着计算机网络和信息技术的高速发展,网络安全形势日趋严峻,大规模攻击日趋频繁。为了防范网络攻击,产生了很多的安全技术。入侵检测系统是继防火墙之后的第二道网络安全屏障,是一种主动的安全防护措施,有效弥补了防火墙的不足。虽然目前的入侵检测系统具有强大的攻击检测能力,但是多数的IDS仍然存在大量重复告警的问题,误报率偏高,告警质量低下,只能检测单步攻击行为,无法反映渗透的整体过程以及攻击者的攻击意图,使得安全管理人员难以管理和分析海量告警数据。

科研问题:如何降低IDS冗余告警带来的负面影响;现有的告警关联方法大多存在需要不同程度的专家知识。

科研目的:基于入侵检测系统根据网络实时流量输出的告警信息,构建网络基本事件图谱,减少冗余信息,降低处理时间复杂度。提出一种基于多因素的告警关联方法,方法核心在于通过结合时间、IP 地址、告警类型等多个因素来综合度量告警间的关系。