2023年4月13日 组会报告摘要-01

我本次汇报的题目是:《联邦学习中的安全和隐私保护问题研究》,我将从科研背景、科研目的、科研问题、研究内容、研究计划五个方面进行汇报。

科研背景

我国高度重视数字经济

在政策方面,2019 年党的十九届四中全会首次将数据与土地、劳动力、资本、技术并列作为重要的生产要素。

在管理机制方面,2023 年国务院组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设。

在行业方面,地方数据交易所进入了高速发展阶段。2022 年上海数据交易所发布了《数据要素流通标准化白皮书》、广东省发布《广东省数据要素市场化配置改革白皮书》,以基于标准化布局保障数据流通、释放数据潜在价值,为数据要素市场化及数字经济发展提供方向指导。

在数字信息凸显,数据安全风险与日俱增,数据泄露、数据贩卖等数据安全事件频发,为个人技术日新月异的发展趋势下,数据已成为数字经济发展的核心生产要素,是国家重要资产和基础战略资源。随着数据价值的愈加隐私、企业商业秘密、国家重要情报等带来了严重的安全隐患。

趋势:1.内外部安全威胁持续升级 2.数据伦理道德问题凸显

因此,国内外相继发布了数据相关的保护条例。

中国三管齐下的信息安全法律框架

科研目的

当前在数据安全的主要矛盾是当前数据已经被定义为了一种生产要素,因此需要数据流动起来而不是形成数据孤岛,才能让数据释放其价值。然而从数据安全的角度来说,一旦数据发生了流动,就会对数据产生安全和隐私相关的问题。因此,对于这样的一种矛盾,联邦学习是一种很好的解决方案,因为每一个client的数据在本地训练,因此可以让数据在不流动的前提下,让数据释放其价值。然而联邦学习本身仍然存在一些安全和隐私的风险。

科研问题

尽管联邦学习通过在本地客户端上进行本地模型训练在一定程度上保护了数据的隐私和安全,但仍然存在一些攻击手段可能泄露个人信息。因此我们希望探究设计联邦学习系统时可能面临的挑战以及可能的解决办法。

研究内容

如下图所示,联邦学习中存在的数据安全威胁主要可以概括为三方面

1.在客户端的隐私保护

2.在服务器的隐私保护

3.联邦安全框架的安全防护

联邦学习的结构与存在的数据安全威胁

对于联邦学习中存在的数据安全威胁、以及对应的一些防护方法,以及采用了一些防护方法又引发的新的需要解决的问题等,将在组会上进行详细的介绍。