2023年7月20日 组会报告摘要-01

这次组会主要介绍《基于深度强化学习的智能电表实时数据压缩》思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。


科研背景:

在传统的电力网络中,各个电力终端采集到的数据将传输到主站统一处理。但随着电网规模的扩大,接入的终端设备和产生的数据量不断增多,数据的传输和处理将耗费大量的网络和计算资源,且无法满足时延和安全性的需求。

物联网(IoT)在电力行业的普及导致了传感器、智能电表和其他电力设备之间的持续连接。在智能电网的某些领域,数十万或甚至数百万个传感器可以同时收集电力消耗数据。因此,电力用户侧的电力消耗数据呈指数级激增。例如,在我国的配电网调度系统中,大约50%的10kV横向数据丢失,给调度操作带来了极大的不便。此外,截至2018年底,国网有限公司已连接5.4亿个各类终端,每日数据采集量超过60TB。

建设智慧物联体系,实现电网各类数据资源实时汇聚与开放共享,大力发展“边缘智能”和边缘物联已成为电力系统打造新一代能源互联网的发展目标。

“边缘智能”意味着更多处理过程将在本地边缘侧完成,只需要将处理结果上传至云端,可以大大提升处理效率,减轻云端压力,更加贴近本地,可以保障数据的安全性,为用户提供更快的响应。

科研问题

用户侧数据采集从过去的每15分钟一次,发展到现在的每1分钟一次,以及未来可能会更高频的1秒采集一次。如果这些传感器收集的所有电力数据都累积在一台服务器上,那么数量将是巨大的。这些巨大的数据量不仅增加了存储成本,而且使数据传输和处理成本高得令人望而却步。展望未来,数据收集对象的总数将迅速增加,数据收集的频率将继续上升。因此,数据存储的压力将进一步加剧,可能阻碍电网数字化发展的推进。

由于这些数据集中存在噪声,数据压缩通常可以提供显著的压缩增益,而不会影响下游应用程序的性能。考虑数据压缩策略以减少传输量变得至关重要,压缩是在收集数据并将其传输到云的边缘设备上执行的。这些边缘设备通常是计算和通信带宽受限的,因此压缩解决方案必须是实时的并且适合这些设备。

如何设计有效的实时压缩解决方案,弥合能源数据存储技术与采集/传输能力之间的差距,减轻边缘计算环境中数据存储和传输的压力,是我们所要关注的问题。

科研目的:

设计了一种电力实时数据压缩机制

来自电力用户端的时间序列数据在数据图中表示为一个一个的数据点。通过选择性地丢弃具有最小信息的数据点,可以在捕获基本特征的同时使用更少的数据点来表示电力数据图像。

构建了一套在边缘端进行实时电力数据压缩的框架

利用边缘计算的能力,传统上在云平台上执行的某些计算任务被转移到网络的边缘。该框架为实现实时电源数据压缩、提高效率和减少延迟提供了一个可行的解决方案。

提出了一种基于深度强化学习SG-DRL算法

该算法基于深度强化学习,专门为智能电网设计,是能源用户的数据压缩建模技术。SG-DRL有效地压缩功率数据,超越了传统方法的限制,实现了更高的压缩率 。

研究内容:

拟考虑将电力用户侧用电数据时序图像看成是一个个点组成的信息图,数据压缩的本质上是丢弃给定信息图的一些点,并将剩余的点保持为简化的数据。

在线方式逐个输入点,而只有大小为W的缓冲器可用,即在整个轨迹简化过程中最多可以保留W个点。我们采用了一种现有的策略,对于前W个点,我们将其直接存储在缓冲区中,对于剩余的每个点,由于缓冲区已满,我们需要将一个点丢弃以获得一些空间,然后将新点存储在缓冲中。与现有的策略不同,这些策略使用一些人工设计的启发式值来决定缓冲区已满时要丢弃哪个点。

我们的目标是为这项决策任务实现一种更智能的方法。具体而言,我们将轨迹简化问题视为一个顺序决策过程,并将其建模为马尔可夫决策过程。

深度强化学习方法建模:

在组会ppt中展示。

实验结果:

在组会ppt中展示。

论文写作分享:

在组会ppt中展示。

后续研究计划:

在组会ppt中展示。

2023-07-13组会摘要-01

本次组会汇报关于联邦学习后门攻防的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景:

•FL作为一种分布式的学习范式,从不同的客户端聚集信息来训练一个共享的全局模型,已经显示出巨大的成功。但由于联邦学习分布式以及隐私保护特性,易受多种攻击,尤其是后门攻击

•后门攻击:攻击者意图让模型对具有某种特定特征(触发器)的数据做出错误的判断,但模型不会对主任务产生影响

•现有的防御方法主要分为两大类:经验后门防御+认证后门防御

•目前,经过认证的防御都是基于随机平滑,而经验防御则有多种类型的方法

科研问题:

尽管已经有大量的研究设计了稳健的聚合方法和针对后门的经验性稳健联合训练协议,但现有的方法缺乏鲁棒性认证。

科研目的:

专注于证明FL对一般威胁模型的鲁棒性,特别是后门攻击,开发可认证的稳健性FL来防御后门攻击

科研内容:

2023年7月13日 组会报告摘要-03

本次组会汇报关于基于知识图谱的网络安全威胁情报推理技术研究的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景

  • 随着信息化不断扩大以及网络技术的持续发展,网络安全事件频发,网络攻击手段也日益呈现复杂多变、长持续性、高隐蔽性等特点。依靠传统的入侵防御系统等被动防御手段无法有效地维护网络空间安全,因此兴起了网络安全威胁情报(CTI)等综合防御策略。网络安全威胁情报是指基于证据的威胁知识,可以为决策提供信息,目的是防御攻击或缩短处理与检测的时间。
  • 网络安全威胁情报在实际应用中主要面临着数据类型多样、分布离散、内容不一致等问题,因此引入了知识图谱技术框架来试图解决这一问题。但构建的知识图谱仍然不够完善且可能存在错误,因此有必要利用知识推理技术来达到完善知识图谱的目的。知识推理是知识图谱中的一个重要问题,它通过对现有事实的推理来预测缺失的事实。
  • 当前在知识图谱上实现推理大致可以分为两类:基于符号规则(本体公理或符号逻辑)的方法和基于表示学习(嵌入)方法。传统基于符号规则的方法主要优点是具备可解释性,主要缺点是不易于处理隐含和不确定的知识;基于表示学习的方法主要优点是推理效率高且能表征隐含知识,主要缺点是丢失可解释性

科研问题

  • 在网络安全威胁情报领域传统的推理模型表现欠佳,例如基于符号规则的知识推理模型存在不易处理隐含知识、规则学习的效率差的问题,而基于表示学习的知识推理模型存在可解释性差、稀疏实体编码能力不足的问题。
  • 传统逻辑规则学习模型生成逻辑规则复杂性高,很难识别出高质量的逻辑规则。

科研目的

  • 提出一种融合表示学习符号规则的知识推理算法,提高发现网络安全威胁情报知识图谱中实体与实体间潜在关系的能力,不断完善威胁情报知识图谱。

研究内容

2023-07-13组会摘要-02

本次组会汇报关于面向区块链智能合约威胁检测的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景:

2009年,比特币开启区块链时代,区块链技术是比特币的基础,它支持去中心化计算模式的转变。区块链技术具有去中心化、防篡改、不可逆及可追溯等特点,已经被应用到医疗、供应链管理、能源互联网等诸多领域中。区块链及其上的分布式应用涉及到大量的金钱,因此成为黑客的一个重要攻击目标。近年来,区块链安全事件层出不穷,从底层P2P网络、中间层虚拟机到上层的智能合约,都成为黑客们攻击的对象。

科研问题:

  • 传统智能合约检测工具大多采用符号执行技术,极大地依赖专家模式,可能造成漏报率和误报率高、难扩展,并且存在路径求解慢,检测时间长的问题。
  • 当前基于机器学习以及深度学习的合约漏洞检测方法大多只利用合约源码或字节码的序列化信息,忽略了代码中函数调用、参数传递等具有方向的图结构信息,对合约特征的挖掘不够。
  • 现阶段的智能合约漏洞检测模型大多基于源代码、字节码序列、CFG和AST等静态特征进行学习和检测。然而静态分析获得的特征是有限的,智能合约漏洞大多是在运行时发生的。应该考虑如何将智能合约的运行时动态特征结合起来扩展模型的特征表示空间。

科研目的:

对由Solidity语言编写的智能合约进行结构化信息读取,并将其转化为图结构的形式,通过图神经网络学习之后,得到图层面上的合约语义表达,进而对区块链威胁进行检测。
主要思路:
通过动态执行和静态扫描,从合约中提取动态漏洞特征和静态漏洞特征,然后通过智能合约字节码构成控制流图,最后使用神经网络训练合约分类模型,对智能合约漏洞进行检测。
引入时序增强的多头注意力机制,增加对合约图边的时序特征的关注程度。

科研内容:

2023-07-06组会摘要03

本次汇报内容为《混合云环境下基于深度强化学习的隐私安全约束下的工作流调度方法》的近期进展,主要从科研背景、科研问题、科研目的、科研内容等方面进行阐述。

科研背景:

  • 随着云计算的快速发展,云平台已被广泛接受用于部署和执行工作流应用程序,工作流所有者可以根据自己的需求动态租用和终止使用服务,并根据实际使用情况付费,工作流调度也引起了广泛的研究兴趣。
  • 混合云是公共云和私有云的结合,它试图利用两种类型的云平台的优点,因此越来越多的企业或组织采用可整合共有云与私有云资源的混合云技术部署系统。

科研问题:

  • 混合云环境中工作流调度时:1.隐私敏感数据和任务不能暴露在公共云平台上 2.云平台上数据传输经过互联网时的安全性和带宽应得到保证
  • 现有的大部分工作流调度算法存在明显缺点,如只能得到局部最优解、计算成本较高、无法处理大规模复杂调度等。

科研目的:

  • 提出一种考虑隐私性和安全性的混合云工作流调度方法,通过深度强化学习(DRL)在混合云中调度工作流,且在满足工作流数据隐私性和安全性的同时,优化调度完成时间和最小化成本。

科研内容:

具体内容将在组会ppt上进行介绍。

2023-07-06组会摘要02

本次组会汇报关于调基于区块链的能源数据细粒度访问控制技术研究的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。

科研背景:

  • 数据共享与访问控制。访问控制技术是保护数据安全、可控共享的重要手段。但目前数据的分布式、动态性特点,使管理和安全需求变得更加复杂,传统的访问控制技术已不再适用。针对应用场景,在分布式访问控制和访问控制动态性两个方面面临着挑战。
  • 基于属性的访问控制。ABAC 将用户和客体资源的属性作为关键决策要素,构造访问控制策略,从而实现更细粒度且灵活的访问控制。

科研问题:

  • 传统访问控制由第三方机构进行的单一权限判决,可能存在用户不可知的越权行为,存在权限判决透明度的问题。
  • 传统的ABAC存在着一个安全问题:访问策略由用户自定义制定,策略的执行依托第三方背书的权威机构,其执行结果往往用户无法跟踪,个人的数据泄露难以察觉。
  • 数据共享中由于动态性和分布式的特点,存在非法访问的行为和恶意节点。

科研目的:

  • 利用区块链智能合约实现策略的分布式自动、可信判决,在禁止非法用户对数据资源访问的同时,提高能源数据资源的共享与流通效率,实现面向分布式能源数据资源的高效、透明、安全的自动化访问控制。
  • 利用区块链可溯源的特性,设计审计合约,实时记录主体的操作记录,以监察授权者的不当授权违规行为,相应地调整授权策略。
  • 信任值可以反应用户的安全状态,设计基于信任的访问控制,将信任值作为评估用户的属性之一,随着访问行为的变化动态评估用户的信任值。

研究内容

基于区块链的能源数据共享模型

2023-07-06组会摘要01

本次汇报内容为《分布式储能网络化运营体系中数据安全与隐私保护问题研究》的近期研究内容,主要从科研背景、科研目的、科研问题、研究内容等几个方面展开。

科研背景:
1.分布式储能的发展:随着可再生能源如太阳能和风能的快速发展,分布式储能系统被广泛应用于能源领域。分布式储能系统通过将能量储存到离散的设备中,提供了更加灵活和可靠的能源供应解决方案。然而,这些系统面临着大量的能源数据安全和隐私信息的管理和保护问题。
2.大规模数据收集:分布式储能系统涉及到多个设备、多个用户和能源供应商之间的数据交换。这些设备产生的数据量庞大,并且包含了各种敏感信息,如能源消耗模式、用户行为习惯等。因此,确保这些数据的安全性和隐私性成为一个重要课题。
3.数据安全威胁的存在:分布式储能系统中的数据安全面临各种威胁,包括网络攻击、数据篡改、恶意软件和未经授权的数据访问等。这些威胁可能导致系统故障、数据泄露、用户隐私曝光等严重后果。因此,研究如何防范和应对这些威胁是保障分布式储能系统可靠性和稳定性的关键。
4.储能信息系统控制指令的安全传输:面临完整性、一致性等问题。

科研问题:
分布式储能信息系统中存在安全威胁和隐私泄露问题
分布式储能网络中,传输分布式储能信息流等指令过程中可能数据窃取、数据纂改等数据威胁攻击者可能截获数据传输过程中的指令或信息流,从而获取敏感的能量储存和管理相关数据或者。可以修改传输过程中的指令或信息流,使其传达错误的命令或误导性信息。这可能导致分布式储能系统执行错误的操作,导致能量管理不准确等,造成隐私泄露和数据安全风险。
信息系统承担扮演控制中心的角色,对分布式网络进行优化调度,可以根据控制中心反馈的全局信息自行调节用电计划、削峰填谷,从而实现节能减排。但是,在分布式优化过程中如果攻击者进行恶意操作,干扰系统控制管理模块的运行会导致影响用户的经济利益,更会影响电网整体的运行效率。

科研目的:
针对以上两点科研问题:
设计分布式储能控制中心向智能终端传输信息指令等信息的安全传输方法;可采用身份验证、数据加密等方法解决数据不安全传输的问题。
针对分布式储能信息系统中分布式数据分析场景中,利用联邦学习解决分布式场景中数据效用和数据隐私之间的问题;但在其过程中上传参数不确定性,提出了一种联邦学习的安全聚合方法研究,对上传的本地模型进行动态评估,筛选恶意模型、加权聚合中心模型,提升中心模型能力。

研究内容:

2023-06-29组会摘要03

本次组会我汇报的题目是《云数据中心联合任务调度和虚拟机放置的深度强化学习方法》,我将从以下几个方面进行讲述:

科研背景

1.云计算是一种通过互联网提供按需计算服务和资源(如计算能力和数据存储)的模型,云计算已经成为当今计算机行业中最流行的计算范式之一。

2.虚拟化是云计算的基本特性之一,虚拟化技术通过减少使用的硬件数量来提高数据中心的能源效率,并通过在物理主机(PH)上放置多个虚拟机(VM)来提高资源利用率。

3.服务水平协议(SLA)是消费者和云服务提供者之间商定的服务条款,它包含了用户对服务质量(QoS)的各种要求。

4.降低能耗已成为当今云数据中心的一个关键问题。根据美国国家资源保护委员会的报告,数据中心的能源消耗占全球总能源消耗的3%以上,并将以每年3%的速度持续增长。在过去的几年里,越来越多的国家实际上已经开始制定法规来降低大型数据中心的能源消耗。

科研问题

在云数据中心中,服务的提供可以通过两个层面进行:

1.第一个层面是任务调度:在这个级别中,每个用户的任务被映射到合适的VM。任务调度是云计算中降低能耗最有效的方法之一,它可以极大地提高作业的执行效率和云系统的资源利用率从而降低能耗。

2.第二层是虚拟机的放置。虚拟机需要放置在能够提供所需资源(即处理器、内存和磁盘空间)的服务器中。因此,在云计算环境中,优化虚拟机布局对提高资源利用率、降低能耗具有重要作用。

该领域以前的工作主要是将任务调度或VM放置作为单独的问题处理。但是任务调度和虚拟机放置问题基本上是相互耦合的,需要一起考虑,以便为云用户和提供商提供有效的解决方案。

I.任务应该选择哪个虚拟机?

II.虚拟机应该选择哪个服务器放置?

III.如何将VM-PH放置与Task-VM调度同时整合?

科研目的

  • 这项工作中,将任务调度和VM放置集成为一个协同优化问题,以更好地优化云数据中心的能源消耗。我们的目标是为现有的VM分配一个输入任务,或者根据任务创建VM,并将新创建的VM分配给服务器。 具体来说,考虑了任务、VM和PH之间的关系,将单层流程(即task-VM和VM-PH)集成为两层流程(即task-VM-PH)。该研究旨在将任务调度到虚拟机时,在满足用户QoS要求的情况下,同时优化云数据中心的能源消耗。

科研内容

  • 系统架构图

具体的科研内容及其建模将在组会上介绍。

2023-06-29组会摘要02

本次组会我汇报的题目是《电力数据发布中的隐私保护研究》,我将从以下几个方面进行讲述:

科研背景


1.随着电力物联网的发展,电力数据开放在信息感知、互联互通、开放共享等方面产生了巨大的作用,大数据、云计算等技术的发展也使电力数据的价值将得到更深入的挖掘。
2.随着电力行业数据开放共享进程的加快,敏感数据泄露的风险也在逐渐增大。如果攻击者对发布的数据进行攻击,商业敏感信息和用户个人信息的泄漏将给企业造成巨大的经济损失、带来法律责任。

科研问题

  • 为了满足匿名模型的要求, 一般需要对原始数据在准标识符属性值上进行泛化操作,其基本思想是通过概括的属性值去代替原有的具体的属性值,容易导致泛化过度,使得数据的可用性下降。
  • 真实数据集属性属性较多,数据集中某些属性的敏感性较低,信息发布对用户的影响较小,很多研究对部分属性进行K-匿名,但这些属性仍有保护的必要性,隐私保护强度还需提高。

科研目的

  • 设计一种基于聚类的数据发布匿名方案,相较于现有方法,能够有效降低数据匿名的信息损失,提高数据发布的质量。
  • 引入差分隐私,对不同敏感程度数据的分层保护,增强数据的隐私性。

科研内容

科研内容部分主要分为基于聚类的K-匿名、基于差分隐私的分层保护、和总体设计部分。