作者归档:奚溪

 2023-11-9 组会报告摘要-02

主要对“基于区块链联邦生成模型的电网用电数据合成研究”文章进行内容梳理,后期以梳理的架构完善论文内容。

科研意义

电网的数字化智能化转型,对提升电力产业核心竞争力、推动电力高质量发展具有重要意义。在这个过程中,数字技术不断发展,与电网管理的融合也逐步深入,用户用电数据的价值被深度挖掘。对用户用电数据进行分析,可以理解用户消费模式以提供更具个性化的使用服务,还可以对电力负荷进行精准预测并实时监控用电负荷行为的异常,从而提高电力系统的灵活性、可靠性和安全性。数据作为必不可少的生产要素起着关键作用。

然而,其在流通和使用中不断创造价值的同时,用户个人信息面临着严重的隐私泄露挑战。在电力能源领域,用户用电数据碎片化和孤立地存储在不同供应商中,许多供应商会因为担心数据流通的隐私泄露风险,而不愿将数据对外开放使用。另外在法律层面上,各国都在不断地推出和加强对数据安全和隐私保护相关法规的完善,因此供应商或企业外部的研究人员在访问用户用电数据时面临很多法律法规限制。这限制了用户用电数据的共享和自由流通,使得电力供应商之间形成了一个个数据孤岛,导致用电数据的训练和分析缺乏大规模的数据。

为兼顾数据隐私和机器学习模型可训练,Google 在 2016 年提出了联邦学习的概念,它是在进行分布式机器学习的过程中,各参与方可借助其他参与方数据进行联合建模和使用模型。参与各方无需传递和共享原始数据资源,仅需上传本地训练得到的模型参数,即在数据不出本地的情况下,进行数据联合训练、联合应用,建立合法合规的机器学习模型。

但联邦学习对机器学习模型训练灵活性差,每次仅能发布单一模型进行训练。训练其他模型时,即使是相同数据,也需召集所有参与方再次共同训练新模型,这极大浪费了各参与方的时间和计算资源。联邦学习依赖于单一的中心服务器,容易受到中央服务器故障或攻击的影响。一旦中心服务器被攻击者瘫痪,则整个数据共享过程便会中断,还可能造成严重的隐私泄露。开放网络中用户互相之间缺乏信任,很难建立数据共享的基础。

科研目的

01 将联邦学习和GAN模型进行集成,以联邦学习的方式使用多方数据训练生成模型GAN,所生成的合成数据可灵活地进行多种机器学习任务,以提供更加智能化的服务。

02 提出一种支持数据合成的区块链联邦生成模型,由区块链为联邦GAN模型训练提供一个信任交互的平台,对参与者训练参数的接收和下发进行统一调度,并进行参数聚合。提高了用户间的信任度和整个训练网络的健壮性。

03 展开了预测用户负荷和分析用户行为的机器学习任务,利用爱尔兰CER的真实数据对支持数据合成的区块链联邦生成模型进行了综合评估,并验证了模型的有效性。

研究内容

2023-06-08组会摘要02

基于区块链的去中心化联邦生成模型研究

科研问题:

联邦学习对机器学习模型训练灵活性差,每次仅能发布单一模型进行训练。训练其他模型时,即使是相同数据,也需召集所有参与方再次共同训练新模型,这极大浪费了各参与方的时间和计算资源。
联邦学习依赖于单一的中心服务器,容易受到中央服务器故障或攻击的影响。这会导致不准确的全局模型更新扭曲所有局部模型的更新。

科研目的:

使用联邦学习训练生成对抗模型,利用生成对抗模型的强大学习能力生成合成数据,代替多方原始敏感数据灵活地进行其他机器学习模型的训练。
部署区块链作为底层架构,去中心化地执行此联邦学习过程,有效防止中央服务器故障或攻击,在确保数据隐私安全下提高联邦学习的鲁棒性。

研究内容:

2023-3-16 组会报告摘要-01

基于智能合约的多方安全联邦生成模型研究

科研背景

1.近年来,机器学习、深度学习等技术快速发展并被广泛应用。数据的丰富程度和质量对深度学习模型的性能有着显著影响。但是,一方面数据主体担心自己的商业秘密和用户隐私泄露,不愿交付数据。另一方面,日益严格的数据安全法规对数据的流通和使用提出了诸多限制。这都导致数据共享成为问题,也缺乏数据使深度学习等技术在各个领域无法研究。 2。联邦学习的兴起使分布式用户无须传输本地数据即可实现联合建模,成为数据共享应用和人工智能方法获取标注数据以落地的新范式。

科研目的

构建基于智能合约的多方安全联邦生成模型,安全地生成合成数据,代替多方原始敏感数据进行自由的共享应用和流通。1.构建异构型的分布式联邦GAN。在联邦中心保留生成器G,在联邦网络中的边缘客户端各自保留一个判别器D。由多个客户端联邦训练GAN模型,生成合成数据。2.通过区块链和安全多方计算解决分布式联邦GAN的信任和安全问题。由区块链提供一个信任交互平台,联邦中心和边缘客户端都是其中平等的用户节点。区块链智能合约负责执行具体的多方安全计算,安全完成生成器和客户端判别器之间的训练参数聚合和交互工作。提升了联邦GAN模型的隐私保护能力。

研究内容

2022-12-15组会报告摘要-03

本次组会汇报的题目是《具有隐私保护的可跟踪可撤销的密文属性基加密方案研究》,会在科研背景、科研问题、科研目的和方法等方面进行介绍。

科研背景

随着云计算技术的发展,云存储系统为用户提供方便、灵活的数据存储和web服务。希捷预测,到2025年,全球数据创建量将增长到163千兆字节。

云存储环境下数据不在本地存储,数据拥有者失去了对数据的完全可控,无法像传统信息系统那样通过物理安全边界防护等技术手段来保障数据的安全。此外,云服务商因经济利益等因素可能作出有损用户数据隐私的行为。

基于属性加密(ABE)已经广泛应用在“一对多”模式的数据共享中,可以实现细粒度的访问控制。

科研问题

传统ABE方案中的访问策略与密文一起存储在云服务器中,因此任何能够检索密文的人都可以获得相关的访问策略。但访问策略中很可能包含敏感信息,导致用户隐私泄露。

可能有恶意用户将解密密钥泄漏给ABE系统中的第三方,又由于不同的用户可能具有相同的属性子集满足访问策略,系统没有可行的方法跟踪并撤销可疑接收方。

科研目的

提出一种具有隐私保护的可跟踪可撤销的密文属性基加密方案(TR-AP-CPABE),实现保护隐私的部分隐藏策略以及对恶意用户的跟踪和撤销。

方法

使用线性秘密共享方案(LSSS)表示访问策略——将表达访问控制树的布尔公式转化为LSSS矩阵。

引入二叉树,将二叉树的叶节点与用户u相关联。

使用白盒可跟踪性,通过给定格式良好的解密密钥绑定用户的身份来跟踪恶意用户。

撤销信息从二叉树和撤销列表中导出,然后在加密阶段进行加密成为密文的一个独立部分。

2022-09-15组会报告摘要03

本次组会汇报的是近期读的一篇论文,是2021年发表在IEEE TSC上的”Blockchain based Multi-Authority Fine-Grained Access Control System with Flexible Revocation”。文章提出了一种基于密钥策略属性的多权限和灵活撤销加密方案(MAFR-KP-ABE),以实现分散授权和灵活撤销的特性。又提出了一种基于MAFR-KP-ABE方案和区块链的细粒度访问控制系统,该系统满足付费数据共享服务的需求,并增强了若干安全属性。

科研背景:

随着云计算的发展,企业和组织更多会选择云服务来进行数据存储和资源共享。但是当用户想安全且有选择地共享数据时,加密数据的云存储给数据细粒度访问控制带来了巨大挑战。并且从2005年至今,属性密码备受学术界和工业界关注,一直是热门研究方向。但是国内外研究侧重纯理论、特定场景解决方案研究,研究成果之间不成体系。

科研问题:

一是实际部署的密码系统离不开用户撤销和用户密钥撤销机制,但既存的属性密码撤销机制无法兼容效率和可靠性,二是访问控制要满足越来越复杂的数据共享需求,传统的数据共享系统面临新的挑战。

科研内容: