分类目录归档：报告摘要

2022-8-18 组会报告摘要-02

本次组会汇报关于调研具有时间约束的区块链能源数据共享方案的思路进展，从科研背景、科研问题、科研目的、研究内容、个人思考总结、计划等几个方面展开。

科研背景：

在数据共享过程中针对不同级别的用户需要赋予不同访问权限。传统的属性加密(ABE)由于可实现一对多的访问控制且可加密的特点为数据共享提供了技术支持。
基于属性加密技术一般应用于中心化集中式的云存储中，但有着其自身局限性，即中心服务器崩溃会导致整个系统宕机，造成存储和共享过程中的数据泄露、丢失等问题。因此，区块链与属性加密技术相结合，可以更好地为海量数据实现安全的可信的大规模共享提供新思路。（李雪莲，2022）

科研问题：

基于区块链的能源数据共享方案并未从时间维度进行访问控制。对于不同级别的用户需要赋予不同访问权限并且只能在有效时间段内才能访问数据，需要具有时间维度的数据共享方案。
时间属性不是静态属性。如用户当前时间不在特定时间段内，则需要立即取消用户的访问权限。这样带来的是与之相对大量的计算和通信之间的开销。动态属性不能很容易地应用于基于属性加密方案中的正常属性。

科研目的：

基于区块链技术研究构建基于时间维度上的链上数据授权共享模式，细化数据对外共享方法。
提出了一种基于区块链的数据安全共享方案。采用基于属性加密技术，实现了对数据的细粒度访问控制。引入智能合约，使数据用户只有在使用期限内才能访问数据。

研究内容

2022-08-18 组会报告摘要-01

这次组会主要介绍《融合LDA模型和情感特征的hashtag推荐》实验进展，《电力投诉文本3W命名体识别》的实验和后续想法分享。

研究背景：

在微博和其他社交媒体平台中，主题标签被用来给用户方便搜索，分类和传播帖子。帖子对用户来说并不总是那么容易，因此帖子通常没有主题标签情况下发布。

科研问题：
推荐系统如何更充分地挖掘深层内容特征在下面三个方面：信息量、信息维度、提取能力。信息量：不同模态输入信息不同；信息维度：存在诸多影响因素；提取能力：去除噪声信息，强化重要信息特征。

研究目的：
让推荐系统更充分地挖掘用户或者话题深层内容特征信息，生成更加符合用户需求的hashtag。

实验说明：

此次组会一共做了两个实验，实验数据均为自己爬取构建。

实验一、二：融合LDA模型和文本情感特征的hashtag推荐；

实验三：电力投诉文本3W命名体识别。

实验数据集：

实验一：

从实验一的热点话题中选择了五个热点话题：

星巴克、刘宇柳叶刀MV、孤勇者、全国统一市场、鹿晗新歌兜风，每个话题爬取50页各1000条左右数据（实际爬下来的数据略少），总共4768条数据，大致按照8：2进行训练集和测试集划分，构建数据集进行实验。

实验二：

从近期热点话题中选择了四个情感色彩浓烈的热点话题：

情感正向积极的两个话题：

#遇见美好#时光温柔

#说走就走的旅行#带着微博去旅行

情感负向消极的两个话题：

#向航班失事遇难者默哀#愿你我起落平安

#长沙居民自建房倒塌#逝者安息

每个话题爬取100页各2000条左右数据（实际爬下来的数据略少），总共近8000条数据，大致按照8：2进行训练集和测试集划分，构建数据集进行实验。

实验二：

总共近4196条数据，包含三个特征，被投诉单位，投诉内容，投诉处理结果。

实验结果：

实验二：

实验三：

3W指who、when、what。

也就是who指被投诉单位，when投诉事件持续时间、what投诉什么。

通过命名体识别，减少人工参与成本，用机器语义帮助提升工作效率。

2022-07-28 组会报告摘要01

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况，报告内容分为：科研背景，科研问题，提示学习实验的设置、提示学习实验结果和最近遇到的问题。其主要内容如下:

科研背景：

由于攻击或者恶意软件的变种层出不穷，为了应对这些攻击或者恶意软件而产生的网络威胁情报也与日俱增。随之而来的是各种专有名词不断涌现，而且普遍存在大量的缩写词，人工识别费时费力，并且实体之间的关系难以界定。

作为信息提取任务的基本组成部分，命名实体识别在自然语言处理 (NLP) 任务中发挥着非常重要的作。NER 任务由两部分组成：识别实体类型和检测实体边界。实体边界检测是指确定一个实体的范围。检测实体边界是将相应类别的标签赋予文本中待识别的实体。
l提示学习通过使用人工设计提示模板 (prompt template) 和答案模板 (answer template)使用预训练模型，在最近的几项NLP相关任务中取得了很好的效果。

科研问题：

对网络安全威胁情报的即时分析是安全专家面临的一个挑战，因为每天生成的网络信息量无法估量。这就需要自动化的信息抽取工具来准确地抽取威胁情报所隐含的信息，继而构建网络安全三元组构建知识图谱来方便查询和检索数据。

模型结构：

通过模板与原始数据的拼接来通过BART模型来进行获得每条拼接后模板的分数，通过答案映射来识别实体。

可能的创新点：

当前对Template-Based Named Entity Recognition Using BART（Leyang Cui et al. 2021）中的模板构造方法进行了优化。
准备不同预训练模型对两个数据集进行实验来测试网络安全文本命名实体识别的性能表现。（Bert，T5，RoBert等）

2022-07-28组会报告摘要-02

以太坊交易中的异常用户检测

科研背景

以太坊是全球最大的区块链网络之一。其自身特性在其他加密货币中独树一帜，得到了更广泛的关注。由于匿名性，在这个庞大的网络中识别异常是一个挑战。传统的基于机器学习的技术，如单类支持向量机和隔离森林，由于在获取以太坊事务中节点间或账户关系信息方面的局限性，在识别以太坊事务中的异常方面有很大的局限性。以太坊事务可以使用属性图有选择性地表示，该属性图具有捕获相互依赖关系的节点和边。

科研问题

如何检测以太坊中的异常交易并识别出异常用户？

方法

2022-07-28组会报告摘要-03

本次组会汇报关于调研建筑能耗预测方向的思路进展，从科研背景、科研问题、科研目的、研究内容、个人思考总结、计划等几个方面展开。

科研背景：
①随着城市化率不断提高，建筑领域能耗在全球总能耗中所占的比例越来越大。《2020全球建筑和建设状况报告》指出，建筑建造和运行能耗占全球总能耗的35%。
②加速建筑领域的节能减排，2020年住建部等十三部门联合发布的《关于推动智能建造与建筑工业化协同发展的指导意见》提到“加大大数据、云计算、人工智能等新技术的集成与创新应用。
③充分利用大数据、人工智能等新技术促进建筑节能、提高建筑能效水平，进而驱动建筑业从工业化向智能化迈进，符合国家重大战略需求，能够为国家“双碳”目标提供有力保障，具有重要社会意义。

科研问题：
①数据稀缺问题
新建建筑或者能源系统管理不完善的数据有限
②数据隐私问题

科研目的：
采用构建基于联邦迁移学习网络一方面解决数据稀缺问题，另一方面解决数据隐私保护的问题。

研究内容：

2022-7-21 组会报告摘要-03

本次组会将汇报最近的研究实验进展，主要内容如下：

【科研背景】

在区块链底层技术的支持下，以太坊已成为最大的金融交易平台。区块链技术是一把双刃剑，它在催生大量基于区块链技术创新的同时也带了许多新的问题。

以太坊已经成为网络诈骗、洗钱等网络犯罪的温床。这表明金融安全已成为以太坊生态系统中的一个关键问题。

【科研问题】

【科研目的】提出一种基于多通道游走嵌入的以太坊网络钓鱼骗局检测方法

【研究流程框架】

【实验分析】

2022.7.21 组会报告摘要—02

本次组会将介绍下一项工作的进展情况，打算沿着隐私保护的方向深入，研究用于速度推荐系统，基于联盟链的隐私保护身份认证方案。目前处于初步调研阶段，主要了解一些车联网中的身份认证协议流程和类型，常见的敌手攻击及设计目标。

当前的调研还不够充分，针对速度推荐系统中的身份认证方案较少，并且车联网场景下的身份认证方案大多实现RSU对车辆的合法认证。后续计划调研基站与车辆双向认证的可行性。

科研背景

交通运输日益复杂，造成了严重的问题，如交通拥堵、燃料过度使用和空气污染。智能速度咨询系统（ISA）已广泛用于协调车辆移动，从而显著提高道路安全、交通稳定性和十字路口吞吐量。
作为ISA的一种特殊类型，基于共识的速度咨询系统（CSAS）可以为在计划路线上行驶的互联和自动驾驶车辆（CAV）推荐共识速度。当车辆以推荐速度行驶时，由于加速/减速频率较低，排的能量消耗有效降低。

科研问题

认证安全问题：现有的身份认证方案主要集中使用第三方，如证书颁发机构（CA）或密钥生成中心（KGC）。缺点是由于认证节点的中心化导致中心节点任务繁重且易受到单点故障攻击的威胁，造成用户敏感信息等数据泄露，且无法有效保护用户身份隐私。

科研目的

速度推荐系统中基于联盟链的隐私保护认证协议：通过区块链技术和智能合约的结合，实现身份存储、认证的高效与可靠；利用公钥密码体制及数字签名技术实现信息传输的保密性和完整性；采用临时公钥进行匿名通信，实现身份隐私的保护。

研究内容

2022-07-14-组会报告摘要-02

基于子图的以太坊异常交易检测

科研背景

区块链在金融领域有广泛的应用，但也吸引了越来越多的网络犯罪。最近，网络钓鱼欺诈已成为区块链安全的一个主要威胁，需要制定有效的监管策略。目前，网络科学已被广泛应用于以太坊交易数据的建模中，进一步引入了网络表示学习技术来分析交易模式。
图挖掘技术作为一种常用的工具，可以有效地表示账户之间的交互信息，将异常交易检测转化为图的分类任务，完成异常交易识别的任务。然而，现有的方法无法平衡可伸缩性和端到端架构，导致高计算消耗和弱的特征表示。

科研问题

现有的交易异常检测方法主要利用图表示学习技术生成账户特征向量，并通过下游的机器学习分类器进一步实现交易异常检测。然而，这些方法并没有实现端到端架构，因此无法学习与任务相关的特性。
虽然图卷积网络通常是通过端到端来实现的，但大多数网络的可伸缩性较差。

科研目的

将异常交易检测作为一个图的分类任务，利用图卷积神经网络实现端到端的异常交易检测。
将交易网络图进行子图采样，提高卷积神经网络的可伸缩性。

整体思路

构建了一个轻量级的以太坊交易网络，并提取了收集到的网络钓鱼账户的交易子图。然后，采用一种基于切比雪夫-GCN的端到端检测模型来精确区分正常账户和异常用户，实现异常交易检测。

2022-07-14组会报告摘要-03

本次组会将对《A Deep Reinforcement Learning-based Preemptive Approach for Cost-aware Cloud Job Scheduling》的研究工作做总结报告，并分享工作过程中的个人思考和总结。

科研背景
1. 云计算是一种计算服务，具有按需分配、可扩展、可靠和灵活等特性。企业使用云平台不仅可以降低IT基础设施的部署成本，也可以简化企业管理和机器维护等工作，提高工作效率。因此，越来越多的企业选择使用云平台部署他们的应用程序，从而为用户提供服务。
2. 云计算中一个核心的研究问题就是作业调度问题。以一种高效的方式实时调度作业请求，不仅可以满足用户的需求，也能为服务提供商节省成本，提高效率。因此，如何以一种合理的方式将作业分配到虚拟机上执行是云计算中的重点研究问题。

科研问题
1.由于作业的高度动态性和复杂性，云服务商很难动态捕捉到实时变化，也就很难找到一种最佳的方式来分配作业。
2.基于DRL的作业调度算法可以解决实时调度问题，但是它只考虑了分配决策的问题，没有考虑到作业在虚拟机中的其他优化问题。

科研目的
我们提出了一个基于DRL的云抢占式成本感知作业调度框架，它不仅可以尽可能的满足用户的响应时间需求，实现实时作业调度，还能够通过抢占机制优化调度性能，提高作业执行成功率，并在此基础上降低虚拟机的执行成本。

研究框架

实验结果
本次实验从不同作业平均到达率、不同作业类型占比和不同虚拟机类型占比三方面进行，实验指标为作业执行成功率、成本和平均响应时间，具体实验结果如下图：

个人思考与总结
本部分重点分享个人在论文写作方面的新的学习心得，通过文章对比找出逻辑漏洞，深入学习写作。

2022-07-07 组会报告摘要02

科研背景

随着信息技术与互联网科技的髙速发展，我们的日常生活越来越离不开互联网，但与此同时，网络攻击也变得更加频繁。目前市面上已经有不少网络安全设备，如ＩＤＳ，然而，由于ＩＤＳ所产生的警报数量非常庞大，少部分的有用信息隐藏在海量的告警日志中。因此，通过对告警日志进行误报消除、关联分析，挖掘出隐藏其中的攻击模式，还原攻击场景，从而发现攻击的真实意图，能够更加有效的防范攻击行为。

科研问题

告警信息冗余：IDS产生海量的告警数据，使得安全管理人员不能聚焦到关键的告警。

现有的告警关联方法大多存在需要不同程度的专家知识。

科研方法

引入网络安全事件知识图谱来处理告警信息，并与通用安全事件知识图谱进行融合。

采用多因素分析的告警关联方式。

主要思路