分类目录归档：报告摘要

2022-04-28-组会报告摘要-03

综合能源系统短期电力负荷预测

文献来源

（1）Xuan W, Shouxiang W, Qianyu Z, et al. A multi-energy load prediction model based on deep multi-task learning and ensemble approach for regional integrated energy systems[J]. International Journal of Electrical Power & Energy Systems, 2021, 126: 106583.
（2）Zhou B, Meng Y, Huang W, et al. Multi-energy net load forecasting for integrated local energy systems with heterogeneous prosumers[J]. International Journal of Electrical Power & Energy Systems, 2021, 126: 106542.
（3）Chen B, Wang Y. Short-term electric load forecasting of integrated energy system considering nonlinear synergy between different loads[J]. IEEE Access, 2021, 9: 43562-43573.
（4）Wang C, Wang Y, Ding Z, et al. A Transformer-Based Method of Multi-energy Load Forecasting in Integrated Energy System[J]. IEEE Transactions on Smart Grid, 2022.

科研背景

1.综合能源系统：以电力系统为核心，通过其内部种类众多的能量转换设备和能源储存设备，实现各种能源系统之间的协调规划、优化运行、协同管理、交互响应和互补互济。

2.构建综合能源系统，有助于
（1）可再生能源规模化开发
（2）传统一次能源利用效率提升
（3）实现社会能源可持续发展

3.实现高效、准确的多能源负荷预测可以为综合能源系统的规划和运行设计提供重要的数据支持，具有重要的现实意义和经济价值。

科研问题

合理有效地对不同能源负荷之间的耦合关系进行建模

整体流程：

2022-04-28组会报告摘要-02

本次组会主要介绍《Preemptive Cost-aware Job Scheduling for Hybrid Cloud using Deep Reinforcement Learning》的研究进展。

科研背景

云计算由于其低成本、高数据处理能力的优势受到了越来越多企业的青睐，很多企业选择把他们的数据迁移到云平台上。
为了适应企业对数据保密性的要求，云计算提供三种不同的服务模式：公有云、私有云和混合云，其中，混合云服务模式是一种融合公有云和私有云的个性化服务模式，企业将私密数据存储在私有云上，但在作业执行过程中借助公有云的计算资源来扩展计算能力，从而达到既节约成本又安全高效的目的。

科研问题

云平台提供的计算资源总是动态变化的，云服务提供商无法实时跟踪到这种变化来智能调度作业从而为使用者提供更高效的服务。
传统的调度算法大多面向批处理作业而不是实时作业调度，也更少人考虑混合云中的实时任务。
在云计算作业调度算法中，大多数都是非抢占式作业调度，没有考虑作业的优先级。

科研目的

本文中我们提出一种基于深度强化学习的混合云抢占式成本感知作业调度框架，用于在混合云中实时调度作业，有效利用计算资源，从而满足用户对作业响应时间的要求，降低执行成本。此外我们还在该框架中加入抢占机制，从而提高作业执行的成功率。

研究内容

图1所示为基于深度强化学习（DRL）的抢占式智能作业调度框架。在该框架中，我们使用DRL方法创建一个智能体代理来实时调度作业，做出合理决策。通过使用DQN算法来不断地训练神经网络，使智能体做出更好地决策，不断优化作业调度机制，从而降低使用者的成本。此外，为了提高作业执行的成功率，我们引入了最短剩余响应时间优先的抢占机制，根据不同作业的优先级合理分配资源，高效利用。

实验结果

图2是加入抢占式机制前后，作业调度成功率的对比图，实验结果表明，加入抢占式机制的作业调度机制可以有效提高作业的执行成功率，但由于实验过程还存在一些问题，目前的提高效果不是很明显，还在继续优化实验结果。

下一步研究计划

优化实验结果
同步开始论文写作（2022.5.20左右）

2022.4.21 组会报告摘要—03

这次组会主要介绍《基于CPU-GPU架构的流程挖掘算法的性能优化》的实验进展。

科研背景

对于企业来说，业务流程在信息系统中留下足迹，而流程挖掘则可以从这些足迹中抽取有用的信息，为企业自身业务流程的理解、改进和重构提供事实依据。
在过去几年中，记录的数据量大幅增加。与这种数据爆炸现象相关的主要挑战不是存储，而是从这些庞大的数据集合中提取有价值的信息。后一个挑战也适用于业务流程的分析。

科研问题

虽然分布式计算框架和平台可以有效地利用数据并行性，但由于它们的计算是在CPU上进行的，它们的并行性仍然受到可用计算资源的限制。因此，如何提高事件数据处理的并行度，成为流程挖掘技术性能提升的重要问题。

科研目的

为了在有限的计算资源中实现高性能，我们提出了使用CPU-GPU架构进行大规模流程挖掘的方法。

整体流程框架

实验结果

下一步计划

完成中文论文的表达方式和逻辑结构修改

2022.4.21 组会报告摘要—01

这次组会主要介绍《A Safe and Eco-friendly Speed Advisory System for Connected and Automated Vehicles Using Consortium Blockchain》的实验进展。

科研背景

作为ISA的一种特殊类型，基于共识的速度咨询系统（CSAS）旨在为在同一路段（如高速公路）或同一区域（如市中心）行驶的内燃机车（ICEV）或电动汽车（EV）车队推荐一致的速度。如果所有车辆都按照建议的速度行驶，对各种类型的道路使用者都有一些明显的好处，例如减少排放（减少加速/减速的频率）、降低能耗、增加吞吐量以及提高安全和健康。

为了实际的扩展，系统必须充分考虑到前车的存在。在保证车辆安全约束的前提下，使得自动驾驶车队的总排放最小。将车辆间最小跟车距离和道路最大速度限制定义为状态约束，提出一个以排放最小为目标的最优控制问题。

科研问题

在之前的CSAS解决方案中，车辆必须将他们的私人数据发送到中央服务器以计算出最佳速度。在中央服务器不够安全或CSAS的服务提供商不受信任的情况下，一个次优甚至随机的速度可能被送回车辆。此外，在这些工作中，车辆也被认为是完全诚实的，忽略了车辆在私人数据收集中的不诚实行为可能导致速度推荐失败的事实。例如，恶意的车辆可能故意发送格式错误的加密数据，导致安全聚合失败。因此，CSAS不仅要确保中央服务器的安全性和可信度，而且要确保隐私数据收集的可验证性。

此外，上述专注于CSAS的工作并没有探索直接考虑前车的存在作为状态约束的可能性。也就是说，相邻车辆施加的车辆安全约束没有被考虑。例如，车辆的行驶速度超过了最高道路速度，后车与前车之间的距离小于安全距离。这些情况会给道路安全带来巨大的风险，从而限制了CSAS的实际扩展。

科研目的

设计一套共识速度推荐的完整流程，使自动驾驶车队的排放最小化，同时避免碰撞和遵守道路速度限制。并且利用联盟链的特点来提高整个推荐系统的安全性和隐私性。

实验进展

实验进展将从以下方面介绍。

*联盟链部分目前待完成，即Performance and Scalability Analysis。讲解的时候参考胡柏吉师兄《A Consortium Blockchain-enabled Secure and Privacy-Preserving Optimized charging and Discharging Trading Scheme for Electric V ehicles》这篇论文中的联盟链性能测试实验图。实验流程和指标是一致的。

2022-04-21 组会报告摘要-02

这次组会主要介绍《基于情感的hashtag推荐》的实验进展。

研究背景：

在微博和其他社交媒体平台中，主题标签被用来给用户方便搜索，分类和传播帖子。帖子对用户来说并不总是那么容易，因此帖子通常没有主题标签情况下发布。

科研问题：
推荐系统如何更充分地挖掘深层内容特征在下面三个方面：信息量、信息维度、提取能力。信息量：不同模态输入信息不同；信息维度：存在诸多影响因素；提取能力：去除噪声信息，强化重要信息特征。

研究目的：
让推荐系统更充分地挖掘用户或者话题深层内容特征信息，生成更加符合用户需求的hashtag。

实验说明：

此次组会一共做了两个实验，实验数据均为自己微博爬取构建。

实验一：LDA预测微博热点事件；

实验二：CNN实现预测文本hashtag。

实验数据集：

实验一：

爬取2022年4月12日当日中午十二点热门微博1969条数据，使用爬取数据content里面的文本，利用LDA模型生成微博热点事件预测结果

实验二：

从实验一的热点话题中选择了五个热点话题，星巴克、刘宇柳叶刀MV、孤勇者、全国统一市场、鹿晗新歌兜风，每个话题爬取50页各1000条左右数据（实际爬下来的数据略少），总共4768条数据，大致按照8：2进行训练集和测试集划分，构建数据集进行实验。

训练集3752*2，文本、标签

测试集1016*2，文本、标签

实验结果：
实验一：

实验二：

将hashtag推荐任务视为一个多分类问题，选择了五类话题样本，星巴克、刘宇柳叶刀MV、孤勇者、全国统一市场、鹿晗新歌兜风，训练模型得到以下结果

后续研究计划：

1.想将LDA主题模型提取特征信息拿给word2vc模型进行特征优化

2.将目前多对一的标签预测，做成多对多的标签预测

3.试着给模型增加情感向量。

不断优化结果，构思如下图：

2022-04-14 组会报告摘要-01

本次组会将介绍个人总结的关论文大修的注意事项以及response letter 的书写格式。

内容主要包括，1.论文大修的注意事项，2.修改意见的解读以及汇总方式，3.常见修改方式及图表描述方法，4. response letter的书写的格式与注意事项

对于论文大修的过程

审稿意见解读

首先，查看论文修改的截至日期。其次，逐条解读专家给出的评审意见，并初步制定出每条修改意见的修改范围。接着，汇总出各个专家的评审意见以及整个论文需要修改的部分。最后确制定出论文大修的修改计划，估计大致所需要的时间，确保能够在规定时间前完成论文的修改。

常见的修改意见

1.Introduction 的内容：缺少与某些概念、数据、方法、实际应用的联系；缺少所采用方法的背景、局限性、优势的介绍。（通过了解专家对Introduction提出的意见，可以帮助日后再写其它文章的Introduction有一个比较好的方向。）

2.related works常存在的问题：仅仅将大量论文在文中陈述，没有细致的分类，缺少各个论文中的优势与不足的分析。建议今后的文章把related works中的论文用一张表格按照类似method和Description进行展示，并按照不同使用方法的特点进行分类。

3.实验部分：常见的实验部分的问题包括实验数据不足，实验数据的分析不够，方法缺少对比等内容，这部分属于比较难改且耗费时间的，需要根据意见和实际情况来决定是按照专家的意见进行修改，还是向专家解释所设定的特定条件。

response letter 的书写

1.回复函最好制成表格的形式，便于审稿人查看自己对论文提出的问题，以及你对该问题的回答和修改内容。(注意：节省审稿人的时间就是节省你自己的时间，最好让审稿人能够只看你的回复函而不需要再去看文章，重新看文章可能又有新的意见提出)

2.对审稿人的提出的意见，放低姿态，认真修改并感谢对方提出的问题。常见的感谢语句：

We thank you for the critical comments and helpful suggestions. We have taken all these comments and suggestions into account, and have made major corrections in this revised manuscript. For the problem that…… We have added ……

Thank you for your comments and suggestion concerning our manuscript. The comments and suggestions are all valuable and very helpful for revising and improving our paper, as well as the important the important guiding significance to our research. We have studied comments carefully and have made correction which we hope to meet with approval:

3.制定出文章修改的综述，方便审稿人和编辑查看论文修改的内容，最好也做成表格

2022-04-07-组会报告摘要-03

基于决策树的自动编码网络的异常能耗检测方法

文献来源

（1）Himeur, Yassine, et al. “A novel approach for detecting anomalous energy consumption based on micro-moments and deep neural networks.” Cognitive Computation 12.6 (2020): 1381-1401.
（2）Himeur, Yassine, et al. “Smart power consumption abnormality detection in buildings using micromoments and improved K‐nearest neighbors.” International Journal of Intelligent Systems 36.6 (2021): 2865-2894.
（3）Aguilar D L, Perez M A M, Loyola-Gonzalez O, et al. Towards an interpretable autoencoder: A decision tree-based autoencoder and its application in anomaly detection[J]. IEEE Transactions on Dependable and Secure Computing, 2022.

科研背景

选择SVM方法时：
DRED数据集准确率和F1-分数达到97.41%
QUD数据集准确率和F1-分数分别达到67.9%和44.59%，均不足70%

选择DNN和KNN方法时：

效果较好，但数据集还有可考虑的属性，例如：温度，湿度，季节等。

方法：

结果

2022-04-07 组会报告摘要-02

本次组会将会介绍阅读论文后产生的想法思路《基于区块链的V2V能源交易框架》，主要从以下几个方面介绍：

科研背景

配备了“充电-放电”双向系统的电动汽车作为移动储能载体可以进行 V2V 的能源交易。
车载单元（On board unit, OBU），可以存储本车的信息，也可以向其他车辆以及路边单元（Roadside Unit, RSU）发送信息。

科研问题

通信和计算负载随着网络规模呈指数级增长，传统区块链中的交易吞吐量太低，无法支持V2V网络中不断增加的频繁交易。
能源交易双方涉及到利益关系，交易双方都期望可以最大化各自的利益，交易双方均对定价满意度高时，用户参与能源交易的积极性才会提高。一般的匹配问题未充分考虑交易定价问题。

科研目的

提出一种基于有向无环图的V2V网络，高吞吐量，快速处理交易。
智能合约充当定价机构。采用博弈论模型，在不涉及双方隐私的前提下，优化电动汽车的充放电行为，在车辆之间以最优交易方案进行协商，从而实现社会福利最大化。

方法

静态贝叶斯博弈问题——双向报价拍卖

基于DAG的共识机制——Hashgraph

研究计划

继续查找相关文献
完善整体思路

2022-03-31 组会报告摘要-03

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况，报告内容分为：科研背景，科研问题，提示学习和基于预训练方式的区别、提示学习的步骤，提示学习在信息抽取方面的相关工作以及最近的实验安排和计划，其主要内容如下:

科研背景：

网络威胁情报文本利用收集、完善和分析收集到的网络攻击信息来应对网络空间领域中存在的威胁[Brown R，2019]。
由于攻击或者恶意软件的变种层出不穷，为了应对这些攻击或者恶意软件而产生的网络威胁情报也与日俱增。随之而来的是各种专有名词不断涌现，而且普遍存在大量的缩写词，人工识别费时费力，并且实体之间的关系难以界定。
网络安全知识图谱主要组成部分：网络安全三元组(<e₁，Relation， e₂>)。在构建知识图谱的过程中，从这些非结构化文本中提取网络安全实体是一项关键和基本的任务。
提示学习是人工设计提示模板和答案模板，在信息抽取工作上取得了不错的效果。

科研问题：

对网络安全威胁情报的即时分析是安全专家面临的一个挑战，因为每天生成的网络信息量无法估量。这就需要自动化的信息抽取工具来准确地抽取威胁情报所隐含的信息，继而构建网络安全三元组构建知识图谱来方便查询和检索数据。

科研目的：

利用提示学习，尝试构建命名实体识别模型，用于识别出威胁情报句子中的实体类型。

提示学习的步骤：

提示学习和基于预训练模型方法的区别：

Pretrain+Fine-tuning的解决方案，需要对于每个任务都重新 fine-tune 一个新的模型，且不能共用。
Prompt Tuning 对于不同的任务重新定义，仅需要插入不同的prompt 参数，每个任务都单独训练Prompt 参数，让下游任务满足预训练方法。

宏观图景框架：

由于提示学习的特性，准备利用提示学习构建命名实体识别模型，构造命名实体识别模板，通过提示学习完成威胁情报句子中的实体类型。之后对于存在两个实体以上的句子利用提示学习方法来完成网络安全三元组的抽取。

2022-03-31 组会报告摘要-02

本次组会主要介绍最近阅读关于负荷预测以及迁移学习一些进展以及思路，暂且将最近研究进展命名为“基于迁移学习与非侵入式负荷监测的多用户智能电表短期负荷预测”

将从以下几个方面展开介绍：

科研背景、科研问题、科研目的、方法、将来的工作、个人思考与总结

①科研背景：据能源调查显示，全球能源约30%能源被家庭用户消耗，并且越来越多的智能电表被普及，通过智能电表显示，可以调研一些更细粒度的数据，通过研究这些数据可以更好的了解用户的能耗习惯，对家庭能耗级别用电量进行预测可以更好从需求侧进行电力的供应。

②科研问题：如果对每个家庭用户单独建模会造成很大的计算开销，并且预测精度会存在问题。

③科研目的：使用迁移学习的思路，首先对一个中心模型进行模型训练，然后根据每个家庭能耗习惯的相似度进行权重的调正可以节省计算资源；引入非侵入式负荷监测进行能耗的分解，将分解后的能耗数据作为迁移学习训练的数据可以提高预测精度。

④方法：

⑤如果该思路具备一定的可行性。考虑纵向整合这些数据可以提高整体小区的预测精度；从横向角度来看，以家庭为单位的预测粒度可以更好的分析用户的消费习惯。

⑥在接下来的工作中，将继续调研关于负荷监测以及迁移学习相关内容完善思路，以及寻找合适的数据集开展下一步工作。