分类目录归档：报告摘要

2022-01-27 组会报告摘要-02

本次组会介绍论文《Smart power consumption abnormality detection in buildings using micromoments and improved K‐nearest neighbors》，主要从以下方面介绍：

介绍理由：

对现有功耗异常检测方案的分类进行全面概述
收集新的异常检测数据集（QUD）
提出了一种使用 OCSVM (UAD-OCSVM) 的新型无监督异常检测方法
提出了一种使用微矩 (SAD-M2) 的新型监督异常检测，它使用 IKNN模型来学习使用微矩范式定义的消耗异常。（IKNN，与传统的 KNN 和其他 ML 方法相比，它可以提高异常检测性能，并且可以进一步减少计算时间。）

科研背景：

目前存在的相关研究方法有各自的优点，但它们也显示出不同的缺点和局限性。
明确地，在能耗中检测用电异常会遇到以下问题和挑战：
缺乏对正常和异常能源使用的精确定义；
正常和异常能源消耗行为之间没有明确的界限；
缺乏带标签的数据集；
使得电力异常检测解决方案的开发成为一项具有挑战性的任务。

科研问题：

如何识别电气设备中的能源异常消耗？
解决此科研问题原因：
能源消耗异常检测是开发高效节能系统、减少整体能源消耗和减少碳排放的关键一步。实现能源消耗异常检测这一目标并告知最终用户他们的能源消耗足迹，并为他们提供改善习惯的建议。在这种情况下，节能有助于促进可持续行为，也有助于减少总能源消耗

方法：

1.OCSVM（无监督）

2.SAD-M2（有监督）

结论：

2022-01-27 组会报告摘要-01

本次组会介绍阅读的一篇论文《Deep Adaptive Input Normalization for Time Series Forecasting》，主要从以下几个方面展开介绍：

科研背景

在时间序列预测领域中，时间序列数据的非平稳性、非线性等性质会造成预测模型精度降低，尤其在金融、电力负荷领域中。所以要对数据进行预处理，标准化是数据预处理中比较重要的一个步骤，本文提出的方法学习如何对给定的任务进行归一化，而不是使用固定的归一化方案。

科研问题

对于预测的时间序列数据进行适当的归一化。

方法

该论文提出的方法开源代码:https://github.com/passalis/dain

部分实验

实验设置：在实验预训练模型中采用锚定评估方法，在提供的十天的数据集中，采用该方法重复训练九次，利用序列数据的相关性有效的提高了模型的训练以及学习效果。实验结论：（1）使用标准化对于提高模型训练能力是必要的；
（2）分布偏移以及一些重尾分布，自适应方法性能更好。

2022-01-20 组会报告摘要-03

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况，并且报告接下来要进行实验的内容，其主要内容如下:

科研背景：

网络威胁情报利用收集、完善和分析收集到的网络攻击信息来应对网络空间领域中存在的威胁[Brown R，2019]。
知识图谱以结构化图的形式描述客观世界中概念、实体及其关系属性，便于机器更好的建模、理解和推理。
网络安全知识图谱通过三元组的形式存储了大量网络威胁信息,对于帮助安全分析师检测网络威胁至关重要。它可以帮助在“安全运营中心”（SoC）工作的安全分析师及时对网络攻击进行响应，并提供防御决策时信息支持。

科研问题：对网络安全威胁情报的即时分析是安全专家面临的一个挑战，因为每天生成的网络信息量无法估量，这就需要自动化的信息抽取工具来方便查询和检索数据。所以如何准确、高效地抽取威胁情报所隐含的信息是要解决的科研问题。

科研目的：l针对收集到的威胁情报，可以识别出威胁情报句子中的实体类型，并提取出不同实体之间存在的关系。

研究的宏观图景框架：

针对整体研究框架，在后续的报告中报告该框架中的实验以及实验中的参数、模型、数据集等情况，并分析实验结果。

下一步计划：

针对下一步的研究计划，准备引入激励学习（promet learning）中的OpenPrompt框架和命名实体识别中的MRC（machine reading comprehension）框架来提高命名实体识别的准确率，并介绍激励学习和MRC的任务定义和主要思想。

密码保护：2022-01-20 组会报告摘要-01

2022-01-13组会报告摘要-02

本次组会将会对我《A QoS-Aware Job Scheduling Framework for Applications in Clouds: DQN Based Deep Reinforcement Learning Algorithm with Preemption》研究计划进行一次详细的报告，具体内容如下：

科研背景与问题：

随着云服务市场规模的不断扩大，许多的IaaS供应商，利于亚马逊，微软等，已经能够为用户提供强大的计算与存储服务。而对于公司与个人用户而言，其能够越来越轻松的通过低成本的方式，租用这些IaaS供应商的服务，因此，越来越多的公司选择将自己的应用迁移到云服务平台上进行运作。在云环境中，基于云平台的应用的资源管理变得尤为的重要，尤其是如何高效地利用服务器的资源。

然而，这同时也带来了相应的挑战，其一是由于在云平台上加载的工作流的大小在不断的变化，对于云服务供应商而言难以去追踪每一个工作流的服务质量。其二，云服务供应商可以提供多种类型的虚拟机，例如高计算性能或高内存的虚拟机实例，并且每一个虚拟机实体的计算性能各不相同。其三，基于云服务平台的应用不仅需要执行用户所提交的任务，同时也需要满足用户对于该应用的服务质量要求。

科研目的与方法：

因此，基于上述的三个挑战，我们提出了一种基于深度强化学习的智能任务调度框架，致力于让处于云端的应用能够自动完成实时任务的调度，并且引入了用户最长等待时间作为评判任务是否成功执行的标准来代表云端应用的服务质量（Quality of Service， aka QoS)。具体框架如图1所示。

与此同时，为了进一步提升任务执行的成功率，我们提出了一种抢占机制，并把这种抢占机制应用到了即将超过用户期待时间的任务中。其中传统的DQN方法会在每次新的任务来临时将任务与VMs的状态空间送到DNN中，从而得出最佳结果，即该任务应该被调度到哪台VM上进行执行。而加入了抢占机制之后，在每次新任务来临时，每台VM的队列都会进行一次检查，使即将到达其最长等待时间的任务抢占该VM，从而在每一次通过DNN进行任务调度之前进行一次内部抢占检测，从而进一步提高任务的成功率。

个人思考与总结

将会与大家分享我的上一篇论文“Vector Autoregression for Predicting COVID-19 Confirmed Cases using Multiple Open Access Datasets: A case study in the UK”中，关于editor给我的拒信的相关内容，总结其中的一些经验教训。

2022-01-13组会报告摘要-01

本次组会将进行《基于深度强化学习的云实例成本感知作业调度》研究进展情况，其主要内容如下：

科研背景：云计算的广泛应用使得越来越多的企业选择将应用程序部署在云端，一般来说，云服务有私有云、公有云以及混合云三种，其中公有云为用户提供按需付费的服务，提供便利。因此，一个高效的面向云实例的智能作业调度框架，可以满足用户需求，降低作业执行成本，合理利用云计算资源。云作业调度框架如图1所示：

科研问题：在云中，计算资源会随着工作负载的变化而进行动态变化，管理者跟踪资源的动态变化需要投入很大的代价，目前几乎所有的作业调度算法都是用来处理批作业的，对于用户提交的事务性作业请求，无法实时的进行作业调度，合理分配资源，满足用户的需求。

科研目的：提出一个基于深度强化学习的智能作业调度框架，在满足用户响应时间要求的基础上，优化作业的执行成本。在我们的作业调度框架中，我们使用DRL方法设置了一个智能体代理，实时的为用户提交的作业做出决策，并使用DQN算法来训练神经网络，帮助智能体更好地做出决策，作业调度框架如图所示：

调度过程：在我们的方法中，作业调度分为两个过程，在线决策和离线训练。在线决策是智能体在作业到达时刻根据当时系统状态做出选择，决定作业在哪台虚拟机上进行处理。离线训练的过程是引导智能体做出更有选择的过程，利用DQN算法进行神经网络的训练，帮助智能体做出更好地选择。

下一步计划：目前提出的方法，每一个独立任务在虚拟机上执行的时候遵循的都是先来先服务式的策略，没有任何抢占机制。因此，在此基础上，我们打算引入作业的抢占机制，让我们的作业调度更加智能。

2022-01-06 组会报告摘要-01

本次组会将会介绍阅读的一篇论文《AMNN: Attention-Based Multimodal Neural
Network Model for Hashtag Recommendation》，主要从以下几个方面介绍：

研究背景：

在真实的社交网络中，标签被广泛应用于理解单个微博的内容。然而，用户在发布微博时并不总是主动添加话题标签，因此需要投入大量精力进行自动的话题标签推荐。作为一种新趋势，用户不再仅仅发布文本，而是更愿意分享多模态数据，如图像。针对这种情况，该论文提出了一种基于注意力的多模态神经网络模型(AMNN)来学习多模态微博的表示并推荐相关的标签。在本文中，我们将hashtag推荐任务转换为一个序列生成问题。提出了一种混合神经网络方法来提取文本和图像的特征，并将它们合并到序列模型中进行标签推荐。

科研问题：
推荐系统如何更充分地挖掘深层内容特征在下面三个方面：信息量、信息维度、提取能力。信息量：不同模态输入信息不同；信息维度：存在诸多影响因素；提取能力：去除噪声信息，强化重要信息特征。

研究目的：
让推荐系统更充分地挖掘用户深层内容特征信息，图片、文字的语义，生成更加符合用户需求的hashtag。

使用方法：

与大多数神经网络方法不同，这些方法将hashtag推荐任务视为一个多类分类问题，在本文中我们将该任务转换为一个序列生成问题。在给定一个带有文本和图片的多模态微博的情况下，我们的模型旨在自动生成一个合适的标签列表。所提出的序列到序列模型的整体架构如如下图所示，其中包括一个混合特征提取编码器和一个用于推荐的耦合解码器。在编码器中，并行神经网络分别提取微博的图像特征和文本特征，合并后送入解码器部分。然后，根据GRU网络获得的标签概率生成标签序列。

我们通过以下步骤执行hashtag推荐。对于给定的图文混合的多模态微博，神经网络模型首先利用带有注意力机制的混合神经网络(编码器)分别提取图文特征向量。然后，AMNN将这两种表示合并，并将输出值输入GRU网络，生成推荐的标签序列(解码器)。为了简单起见，我们使用贪婪搜索算法为推荐生成最终的top-K hashtag。由于输出的单词经常是重复的，我们也在每一步中筛选出重复的单词。

论文数据集：

论文代码复现：

2022-01-06 组会报告摘要-02

本次组会将会介绍阅读的一篇论文《Blockchain-Based Trust Management Model for
Location Privacy Preserving in VANET》，主要从以下几个方面介绍：

科研背景

在智能交通安全领域，车载自组网(VANET)在智能交通系统中发挥着重要作用。通过收集和分析道路信息，如前方道路状况，交通是否拥堵等等，可以为车辆判断路流状况，规划最优行驶路线，从而提高运输安全性和行驶效率。

科研问题

车辆用户希望在不泄露个人隐私信息的前提下享受到基于位置的服务（LBS）。最主要的个人信息泄露有三个方面：

车辆和位置服务提供商（LSP）间传输信息过程中遭受恶意攻击
LSP越权获取敏感信息
匿名集成员相互不信任

方法

提出了一个基于区块链的位置隐私保护信任管理模型。为了保证车辆的隐私安全，构建了匿名隐身区域并提出了一种信任管理算法来约束和规范车辆的行为，利用区块链实现了车辆的数据安全。

结论

主要提供了一种基于区块链的 VANET 位置隐私保护信任管理模型，解决车辆向 LSP 请求 LBS 时可能遭到隐私泄露的问题。

使用区块链记录车辆的请求信息以抵御外部攻击。
提出改进的分布式K匿名算法以避免 LSP 从查询请求中违规获取车辆的个人隐私信息。
设计以路边单元（RSU）为主导的信任管理模型，以解决匿名集内部成员的互信问题。

2021-12-30 组会报告摘要-02

本次组会将介绍《A Consortium Blockchain-enabled Privacy-Preserving Speed Advisory System for Automated Vehicles》的进展情况，其中主要内容包含如下：

科研背景

场景：由于融合车载传感器(如雷达、激光雷达、视觉摄像机等)和全球导航系统的通信技术(如车对车、车对基础设施等)的发展，在过去的几年里，车辆已经配备了连接和自动化技术。联网和自动化车辆(CAVs)更容易获取所需的交通信息，因此与人工驾驶车辆相比，它们可以更精确地控制。这些优点可以减少因人为失误造成的交通事故，提高交通流的稳定性和吞吐量。

目的：作为ISA的一种特殊类型，基于共识的速度咨询系统（CSAS）旨在为在同一路段（如高速公路）或同一区域（如市中心）行驶的内燃机车（ICEV）或电动汽车（EV）车队推荐一致的速度。如果所有车辆都按照建议的速度行驶，对各种类型的道路使用者都有一些明显的好处，例如减少排放（减少加速/减速的频率）、降低能耗、增加吞吐量以及提高安全和健康。

扩展：为了实际的扩展，系统必须充分考虑到前车的存在。在保证车辆安全约束的前提下，使得自动驾驶车队的总排放最小。将车辆间最小跟车距离和道路最大速度限制定义为状态约束，提出一个以排放最小为目标的最优控制问题。

科研问题

不可信问题：在上一篇论文中，我们考虑了传统中心化架构中的路边基站不可信问题，它可能恶意删改、使用数据，造成隐私泄露问题，因此我们基于区块链技术提出了去中心化的的速度推荐系统架构。但路边基础设施应用广泛，如何基于基站进行可信的和隐私保护的速度推荐仍是需要解决的问题。同时考虑了车辆用户不可信问题，有些恶意用户存在不诚实行为，可能破坏速度推荐过程。

如何安全驾驶：为了保证速度推荐过程中的安全性，需要考虑与前车的最小跟车距离与道路限制速度。

科研目的

设计一套共识速度推荐的完整流程，使自动驾驶车队的排放最小化，同时避免碰撞和遵守道路速度限制。并且利用联盟链的特点来提高整个推荐系统的安全性和隐私性。

系统架构