分类目录归档:其他

2023年5月18日 组会报告摘要-02

本次组会汇报关于基于知识图谱的网络安全威胁情报推理技术研究的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景

  • 随着信息化不断扩大以及网络技术的持续发展,网络安全事件频发,网络攻击手段也日益呈现复杂多变、长持续性、高隐蔽性等特点。依靠传统的入侵防御系统等被动防御手段无法有效地维护网络空间安全,因此兴起了网络安全威胁情报(CTI)等综合防御策略。网络安全威胁情报是指基于证据的威胁知识,可以为决策提供信息,目的是防御攻击或缩短处理与检测的时间。
  • 网络安全威胁情报在实际应用中主要面临着数据类型多样、分布离散、内容不一致等问题,因此引入了知识图谱技术框架来试图解决这一问题。
  • 当前在知识图谱上实现推理大致可以分为两类:基于符号规则(本体公理或符号逻辑)的方法和基于表示学习(嵌入)方法。传统基于符号规则的方法主要优点是具备可解释性,主要缺点是不易于处理隐含和不确定的知识;基于表示学习的方法主要优点是推理效率高且能表征隐含知识,主要缺点是丢失可解释性

科研问题

  • 网络安全威胁情报在实际应用过程中存在使用多个数据源海量数据难以处理的问题。
  • 在网络安全威胁情报领域单一使用基于符号规则的知识推理模型或基于表示学习的知识推理模型表现欠佳。

科研目的

  • 分析网络安全威胁情报特点,将多个数据源关联起来,构建一个网络安全威胁情报知识图谱。
  • 提出一种融合表示学习符号规则的知识推理算法,提高发现网络安全威胁情报知识图谱中实体与实体间潜在关系的能力,不断完善威胁情报知识图谱。

研究内容

  • 知识图谱构建
  • 知识推理模型

2023年4月20日 组会报告摘要-02

我本次汇报的题目是:《基于生成式对抗网络的网络流量异常检测方法研究》,我将从科研背景和意义、研究内容与方法、总结展望三个个方面进行汇报。

2023年4月20日 组会报告摘要-01

我本次汇报的题目是:《横向联邦学习下的后门攻防初探》,我将从联邦学习和后门攻击、联邦下的后门攻击、集中式后门和分布式后门攻击等

联邦学习
每个机构都有自己的数据,联合起来是一个完整的大数据库,可用来训练一个大数据模型。
出于安全和隐私的限制,每一个机构都不想或者不能把数据和别人共享。数据以孤岛的形式存在。
定义:使多个参与方在保护数据隐私、满足合法合规要求下前提继续进行机器学习,解决数据孤岛问题

后门攻击
在训练数据中加入部分注入特殊触发器的样本,训练得到嵌入后门的模型,则在预训练阶段,模型遇到带有该触发器的样本时会自动出现错误预测
后门攻击目的:保持对原始数据精度的前提下,在输入嵌入触发器时,模型将其分类至目的标签

联邦下的后门攻击
如何将后门攻击应用在联邦学习中?
• 后门应该作用于全局模型。
• 后门应该在全局模型中存活多轮。
• 后门不影响全局模型的整体准确性

集中式与分布式后门攻击
集中式后门攻击定义:基于联邦学习使恶意参与方可以直接影响联合模型这一事实,指恶意触发器被注入到一个客户端的本地训练数据集。

2023年4月13日 组会报告摘要-01

我本次汇报的题目是:《联邦学习中的安全和隐私保护问题研究》,我将从科研背景、科研目的、科研问题、研究内容、研究计划五个方面进行汇报。

科研背景

我国高度重视数字经济

在政策方面,2019 年党的十九届四中全会首次将数据与土地、劳动力、资本、技术并列作为重要的生产要素。

在管理机制方面,2023 年国务院组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设。

在行业方面,地方数据交易所进入了高速发展阶段。2022 年上海数据交易所发布了《数据要素流通标准化白皮书》、广东省发布《广东省数据要素市场化配置改革白皮书》,以基于标准化布局保障数据流通、释放数据潜在价值,为数据要素市场化及数字经济发展提供方向指导。

在数字信息凸显,数据安全风险与日俱增,数据泄露、数据贩卖等数据安全事件频发,为个人技术日新月异的发展趋势下,数据已成为数字经济发展的核心生产要素,是国家重要资产和基础战略资源。随着数据价值的愈加隐私、企业商业秘密、国家重要情报等带来了严重的安全隐患。

趋势:1.内外部安全威胁持续升级 2.数据伦理道德问题凸显

因此,国内外相继发布了数据相关的保护条例。

中国三管齐下的信息安全法律框架

科研目的

当前在数据安全的主要矛盾是当前数据已经被定义为了一种生产要素,因此需要数据流动起来而不是形成数据孤岛,才能让数据释放其价值。然而从数据安全的角度来说,一旦数据发生了流动,就会对数据产生安全和隐私相关的问题。因此,对于这样的一种矛盾,联邦学习是一种很好的解决方案,因为每一个client的数据在本地训练,因此可以让数据在不流动的前提下,让数据释放其价值。然而联邦学习本身仍然存在一些安全和隐私的风险。

科研问题

尽管联邦学习通过在本地客户端上进行本地模型训练在一定程度上保护了数据的隐私和安全,但仍然存在一些攻击手段可能泄露个人信息。因此我们希望探究设计联邦学习系统时可能面临的挑战以及可能的解决办法。

研究内容

如下图所示,联邦学习中存在的数据安全威胁主要可以概括为三方面

1.在客户端的隐私保护

2.在服务器的隐私保护

3.联邦安全框架的安全防护

联邦学习的结构与存在的数据安全威胁

对于联邦学习中存在的数据安全威胁、以及对应的一些防护方法,以及采用了一些防护方法又引发的新的需要解决的问题等,将在组会上进行详细的介绍。

2023年4月6日 组会报告摘要-02

我本次回报的题目为《推荐系统的个性化隐私保护研究》,我将从科研背景、科研问题、科研目的、研究内容、研究计划五个方面进行汇报。

科研背景

荐系统作为缓解信息过载问题的有效途径, 其通过过滤无用信息进而筛选出用户可能感兴趣的物品以此达到提升用户体验和商户利润的目的。因而该技术得到了许多学者们的广泛关注。如何在保证用户隐私与数据安全的前提下分析用户行为模式成为了近年来研究的热点。

科研问题

隐私保护技术需要可信服务器的支持,实际中,难以找到一个完全可信的服务器。

不同用户对隐私保护的需求不同,如何平衡用户的隐私保护需求和推荐准确性要求,成为了当前亟需解决的问题。

科研目的

设计一个满足本地化差分隐私的推荐系统,为用户选择合适的隐私预算,满足不同用户个性化的需求。

科研内容

推荐算法

本地化差分隐私的推荐系统

具体内容将在组会上详细介绍。

2023年4月6日 组会报告摘要-01

我本次汇报的是我的研究课题《考虑数据隐私保护的BTM光伏发电预测:一种联邦深度强化学习方法》,我将从科研背景、科研问题、科研方法、研究计划、参考文献五个方面进行汇报。

科研背景

“表后”的术语(behind the meter,BTM)是指位于单个实体拥有的单个建筑物或多个设施中的可再生能源系统.通常与分布式发电和存储单元一起运行,以满足最终用户的全部或部分能源需求,BTM 系统的关键部分是通过有效的优化和调度算法来协调负载。

主要特点:1位置(区分behind-the-meter (BTM) and front-of-meter systems ?能源系统相对电表的位置) 2.现场生成(用户资产上产生任何能源的都视为表后,包括pv,小型风力涡轮机,甚至燃气发电机等) 3.现场发电使用 4.现场储能 5.不可见(对于服务商,没有记录,没有监测)

按照尺寸分类一般可分为二类:智能家居、微电网

好处:经济效益、减少温室气体、延期电网投资、提高电网弹性和电能质量、能源独立和安全

BTM系统可能的影响

电力系统变化:大量的BTM光伏系统,on-site发电量的增加导致了电力系统的运行和规划的变化,特别是在一天中的关键时刻,负载预测发生了变化
改变区域负荷:大量BTM光伏系统会显著改变区域净负荷曲线的形状,并带来平衡和可靠性挑战,如中午高峰显著下降,而后夜升高
电力公司难以观测:电力公司只能获得用户累积的净负载数据,BTM光伏系统情况下,难以将光伏与实际负载分开观测
负荷预测退化:大量BTM渗透,对负载预测质量下降,阻碍可靠和高效的网络

科研问题

对比btm的影响来说,有减轻甚至避免的方法,核心就是对BTM光伏系统的容量和未来发电量提前预测。

表后预测光伏问题:精度、安全、隐私和适配

科研目的

1.提出了一种深度强化学习(DRL)中的深度确定性策略梯度(DDPG)算法作为BTM光伏发电预测的基本预测模型,与传统预测方法相比,可以提高预测精度。
2.为了处理数据的隐私性和开放性、资源开销等,提出了一种分布式联邦预测方案,该方案结合了联邦学习和DRL(FedDRL),用于多区域的BTM发电预测。

研究内容

联邦学习主要由一个联合服务器和多个客户端组成。大多数训练过程都是在每个客户端的边缘设备上本地完成的。原始数据彼此之间不共享,通过共享参数的方式,适用于解决数据隐私和分布式场景的问题。
DDPG作为一种深度强化学习算法,在解决连续动作空间问题方面具有高效稳定的能力。并且它是基于Actor-Critic(演员—评论家)框架的算法,该框架有四个神经网络。Actor(演员)和Critic(评论家)各包含一个主网络和一个目标网络。

具体研究内容将会在组会详细介绍。

2023年3月30日 组会报告摘要-03

我本次汇报的是我的研究课题《基于深度强化学习的呼叫中心调度问题的研究》,我将从科研背景、科研问题、科研方法、研究计划、参考文献五个方面进行汇报。

科研背景:

呼叫中心已经成为企业的重要组成部分 ,良好的呼叫中心可以提供一下优势:

(1)客户的满意度和忠诚度;

(2)企业的客户服务水平和竞争力。

呼叫中心的路由问题在呼叫中心中是重要的,如果路由策略不得当,可能会导致以下问题:(1)客户等待时间过长,导致客户不满意或放弃服务;

(2)坐席空闲时间过多,导致坐席浪费资源或失去积极性;

(3)坐席技能匹配度低,导致服务质量下降或客户转接次数增加。

科研问题:

所以,我们的科研问题就是如何利用深度强化学习(DRL)设计一个智能并且实时的呼叫中心调度策略,以提高呼叫中心的服务质量和运营效率。

科研方法:

具体的研究方法将会在组会详细介绍。

2023年3月30日 组会报告摘要-02

我本次汇报的题目是《分布式电网中基于差分隐私的联邦异常检测方案》,我将从科研背景、科研问题、科研目的、研究内容等方面进行阐述。

科研背景

1.智能电网代表了电网发展的一个新阶段,它集成了人工智能、大数据、云计算和5G等技术进步,以管理电能的产生、分配和消耗。智能电网通常使用先进计量基础设施或智能电表来监测电力流。智能电表通过提供详细的用电信息,来实现一些目的比如快速停电检测、更快的服务恢复能力和更好的计费控制,从而使客户能够做出明智的决定。

2.智能电网也会面临各种问题,停电、设备故障、能源盗窃和网络攻击。特别是,对手可能会利用网络中的安全漏洞发动复杂的网络攻击影响电网的正常的正常运行。这些问题可以通过分析智能电表收集的数据、检测电网中的异常来识别。

科研问题

1.智能电网中的异常主要是时间序列异常

2.现有的时间序列异常检测方案大多是根据训练数据所获得的知识进行预测和重构,比较序列和重构序列的匹配程度生成异常分数。

3.对于分布式场景下的时间序列异常通常使用联邦学习的方式来进行,联邦学习本质上提供了隐私保证。但发送到服务器的一些模型参数与训练数据也是密切相关的。因此,这种无意信息泄漏的情况可能被对手利用来推断关于训练数据的信息,从而使得联邦学习容易受到推断攻击。因此,有必要通过采用其他技术来进一步加强联邦学习的隐私性和安全性。

科研目的

构建基于差分隐私的联邦transformer异常检测模型,在保护本地数据的同时,实现分布式异常检测。主要分为两个环节:构建联邦Transformer模型;使用差分隐私保护联邦Transformer的隐私。

研究内容

具体将在组会进行详细介绍

2023年3月30日 组会报告摘要-01

我本次汇报的题目是《混合云环境下基于深度强化学习的隐私与安全约束条件下的工作流调度》,我将从科研背景、科研问题、科研目的、研究内容等方面进行阐述。

科研背景

1.随着云计算的快速发展,云平台已被广泛接受用于部署和执行工作流应用程序,工作流所有者可以根据自己的需求动态租用和终止使用服务,并根据实际使用情况付费,工作流调度也引起了广泛的研究兴趣。

2.混合云是公共云和私有云的结合,它试图利用两种类型的云平台的优点,因此越来越多的企业或组织采用可整合共有云与私有云资源的混合云技术部署系统。

科研问题

1.混合云环境中工作流调度时:

   ①隐私敏感数据和任务不能暴露在公共云平台上

   ②云平台上数据传输经过互联网时的安全性和带宽应得到保证

2.现有的大部分工作流调度算法存在明显缺点,如只能得到局部最优解、计算成本较高、无法处理大规模复杂调度等。

科研目的

提出一种考虑隐私性和安全性的混合云工作流调度方法,通过深度强化学习(DRL)在混合云中调度工作流,且在满足工作流数据隐私性和安全性的同时,优化调度完成时间和最小化成本。

研究内容

具体将在组会进行详细介绍。