2022-3-24 组会报告摘要-03

本次组会介绍是在《A Novel Network Abnormal Traffic Detection Method Based Neural Network for Imbalanced Network Traffic》研究工作的基础上,为了解决模型训练数据的共享和隐私问题,提出《Federated Learning With Blockchain for Intrusion Detection in Industrial IoT》,主要内容如下:

科研背景

在5G技术的支持下,未来的物联网设备将随时随地的保持着低延迟和高可靠性,每个设备都可以存储高质量的网络入侵检测模型,即使在失去连接的情况下也能够做出决策。为了保证设备上模型的准确性,需要与其他设备交换数据以获取更多的数据样本。

近年来,随着人们对隐私重视程度的增强,数据隐私保护方面出台了一系列的法律法规,数据隐私保护相关法律体系呈现日益健全化与规范化。出于保护商业机密、数据监管以及数据整理成本等因素考虑,加之缺乏激励机制,物联网中的数据所有者当前也缺乏数据共享的动力。

科研问题

1.传统联邦机器学习模型依赖单一的中央服务器,容易受到服务器故障的影响;

2.没有适当的奖励机制来激励用户提供数据训练和上传模型参数。

科研目的

1.使用区块链代替中央服务器,区块链网络允许交换设备的本地模型更新;

2.利用分布式联邦的方法共享模型参数而不披露实际数据,确保数据的安全性和隐私性;

3.采用POW和POA相结合的共识机制,验证和提供相应的奖励。

宏观图景框架

2022.3.24组会报告摘要

本次将会介绍有关《基于小波降噪和模糊聚类的漂移数据流自适应预测》的进展情况。主要内容如下:

科研背景:

当前的模型和算法越来越需要在非平稳环境中学习,因为可能会出现概念漂移(或模式转移)的现象,也就是说,数据分布相同的假设在数据流中可能是无效的。一旦数据模式发生变化,建立在以前的、现在已经过时的数据基础上的训练有素的模型就无法为未来的数据提供准确的预测。为了获得可靠的预测,理解数据流中现有的模式以及在建模过程中了解当前示例所属的模式非常重要。

科研问题:

1.网络流量是非平稳数据,存在突变的几率高,现有的模型在个体数据突变时,应对能力不强。

2.现有的模型或方法难以准确预测非平稳环境中可能会发生模式转移的数据。

3.在进行模式归类时,将一个实例明确归为某一种模式是不明确的,会导致预测精度下降。

科研目的:

提出一种基于小波和模糊聚类的预测方法,能够有效的解决模式变换带来的预测精度下降问题,缓解非平稳数据中噪音对模型的影响,综合提高预测精度。

实验流程:

未来计划:

1.3.31之前完善实验,填补论文实验部分。

2.针对窗口长度的选择或者是自适应变化还有待进一步研究,可变长度的窗口必然可以提升精度,但是如何可变,还需要阅读相关论文进一步研究。

3.对于概念漂移来说,噪音的影响巨大,虽然用小波降噪来解决,可以查看是否有变体小波,可以针对该数据集,达到较好的效果。

2022-3-24 组会报告摘要-01

上次组会中,提出了《A Consortium Blockchain-enabled Privacy-Preserving Speed Advisory System for Automated Vehicles》的研究思路,包括科研背景、问题和目的,系统架构。在研究计划中还未完成能耗模型和具体隐私保护方案设计。这次组会将沿着上次的科研背景和问题,详细介绍系统架构、工作流程、隐私保护方案以及实验和论文计划,其中背景、问题和目的沿用上次内容。

科研背景

场景:由于融合车载传感器(如雷达、激光雷达、视觉摄像机等)和全球导航系统的通信技术(如车对车、车对基础设施等)的发展,在过去的几年里,车辆已经配备了连接和自动化技术。联网和自动化车辆(CAVs)更容易获取所需的交通信息,因此与人工驾驶车辆相比,它们可以更精确地控制。这些优点可以减少因人为失误造成的交通事故,提高交通流的稳定性和吞吐量。

目的:作为ISA的一种特殊类型,基于共识的速度咨询系统(CSAS)旨在为在同一路段(如高速公路)或同一区域(如市中心)行驶的内燃机车(ICEV)或电动汽车(EV)车队推荐一致的速度。如果所有车辆都按照建议的速度行驶,对各种类型的道路使用者都有一些明显的好处,例如减少排放(减少加速/减速的频率)、降低能耗、增加吞吐量以及提高安全和健康。

扩展:为了实际的扩展,系统必须充分考虑到前车的存在。在保证车辆安全约束的前提下,使得自动驾驶车队的总排放最小。将车辆间最小跟车距离和道路最大速度限制定义为状态约束,提出一个以排放最小为目标的最优控制问题。

科研问题

不可信问题:在上一篇论文中,我们考虑了传统中心化架构中的路边基站不可信问题,它可能恶意删改、使用数据,造成隐私泄露问题,因此我们基于区块链技术提出了去中心化的的速度推荐系统架构。但路边基础设施应用广泛,如何基于基站进行可信的和隐私保护的速度推荐仍是需要解决的问题。同时考虑了车辆用户不可信问题,有些恶意用户存在不诚实行为,可能破坏速度推荐过程。

如何安全驾驶:为了保证速度推荐过程中的安全性,需要考虑与前车的最小跟车距离与道路限制速度。

科研目的

设计一套共识速度推荐的完整流程,使自动驾驶车队的排放最小化,同时避免碰撞和遵守道路速度限制。并且利用联盟链的特点来提高整个推荐系统的安全性和隐私性。

能耗模型

基于联盟链的共识速度推荐流程

隐私保护方案

2022-3-17组会报告摘要03

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究,主要内容如下:

科研背景:
近几年来,云计算技术的飞速发展,国内外涌现了大量云计算服务提供商,他们提供了大量计算和存储资源,为众多应用程序开发者提供了便捷,低成本的基础服务平台,使得越来越多的应用程序供应商将应用程序迁移至云平台。随着云计算的覆盖程度不断加深,应用程序对于云计算的要求也不断提高。

云计算环境受网络、负载等因素影响,具有动态性和不确定性,这使得实现云计算资源管理和性能优化成为了重要问题。在过去几年的研究中,针对云任务调度问题,提出的算法大多是批处理任务,而不是实时处理任务,这对于用户服务质量要求高的应用,如购物应用,竞拍应用等,批处理往往难以达到用户要求。

科研问题:
在实际情况中,云应用提供者希望能满足用户的服务质量要求,在很多场景中,如购物等,任务请求不断随时间变化,批任务处理往往无法满足用户要求。因此,如何实现实时任务调度,提高任务调度和处理速度,成为云计算研究领域的重要问题。

科研目的:
为了实现云计算实时任务调度,我们针对workflow(工作流)任务提出使用深度强化学习和元启发式算法相结合的方法DQN-GA。该方法以深度强化学习DQN算法作为智能任务调度器进行任务实时调度,以元启发式算法遗传算法作为部署模块在虚拟机中部署workflow任务,通过训练DQN算法,实现对workflow任务的实时调度。

流程框架:


2022-3-17 组会报告摘要-01

本次组会将会介绍最近关于电动汽车充电桩推荐过程中的隐私保护问题研究的研究进展,主要内容如下:

科研背景:
截至2021年6月底,全国新能源汽车保有量达603万辆,占汽车总量的2.06%。其中,纯电动汽车保有量493万辆,占新能源汽车总量的81.68%。截至2021年3月,国内公共类充电桩约85.1万台。

2021年9月,工信部指出,相关企业要采取管理和技术措施,按照车联网网络安全和数据安全相关标准要求,加强汽车、网络、平台、数据等安全保护,监测、防范、及时处置网络安全风险和威胁,确保数据处于有效保护和合法利用状态,保障车联网安全稳定运行。

区块链与车联网的集成不仅提高了安全性、隐私性和信任度,在适应灵活性和处理海量数据的同时,还提高了系统性能和自动化程度。因此,应该合理的将区块链技术与车联网结合起来。

科研问题:
1.使用中心服务器收集计算数据的方式,存在着隐私泄露的问题;
2.车辆位置信息的是隐私数据,其泄露会导致车主个人信息泄露等隐私安全问题;
3.充电桩未被合理利用的现象。

科研目的:
1.基于区块链的隐私保护电动汽车充电桩推荐系统;
2.基于同态加密的充电桩匹配算法。

整体流程框架:

2022-3-17 组会报告摘要-02

本次组会将会介绍阅读的一篇论文《Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings》,主要从以下几个方面介绍:

科研背景

知识图谱(Knowledge Graph)由Google于2012年率先提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。

知识图谱多跳问题 (Multi-hop Questions) 指的是那些需要知识图谱多跳推理才能回答的问题。例如,若要回答 ”成龙主演电影的导演是哪些人?“ 这一问题,则需要多个三元组所形成的多跳推理路径 <成龙,主演,新警察故事>, <新警察故事,导演,陈木胜> 才能够回答。

近年来,使用知识图谱嵌入在知识图谱中进行链接预测已经成为一个热门的研究领域,通常的方法是为知识图谱中的三元组(h,r,t)定义一个分数函数,使正确答案的分数高于错误答案的分数。

科研问题

相比单跳问答,多跳知识图谱问答(KGQA)需要在包含大量知识的知识图谱中找到多个有关联的三元组,并建模多跳长路径,然而知识图谱通常不完整,缺少很多链接,这给KGQA带来了挑战。

  • 最近关于多跳KGQA的研究试图使用相关的外部文本来弥补KG稀疏问题,但这些文本并不总是现成的且相关文本的可用性和识别本身就是一个挑战,这限制了此类方法的适用性。
  • 在另一项研究中,已经有提出KG嵌入方法,通过执行缺失链接预测来减少KG稀疏性,但迄今为止还没有针对多跳KGQA进行探索。

方法

本文用三个模块来提高知识图谱多跳问答的性能:

  • 知识图谱嵌入模块:为KG中所有实体创建embeddings。
  • 问题嵌入模块:得到问题的embedding。
  • 答案选择模块:减少候选答案实体并选出最终的答案。

模型