分类目录归档:报告摘要

2022-06-09 组会报告摘要03

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况,报告内容分为:科研背景,科研问题,提示学习方案选择、提示学习训练的步骤,提示学习实验结果和最近遇到的问题。其主要内容如下:

科研背景:

  • 由于攻击或者恶意软件的变种层出不穷,为了应对这些攻击或者恶意软件而产生的网络威胁情报也与日俱增。随之而来的是各种专有名词不断涌现,而且普遍存在大量的缩写词,人工识别费时费力,并且实体之间的关系难以界定。
  • 作为信息提取任务的基本组成部分,命名实体识别在自然语言处理 (NLP) 任务中发挥着非常重要的作。NER 任务由两部分组成:识别实体类型和检测实体边界。实体边界检测是指确定一个实体的范围。检测实体边界是将相应类别的标签赋予文本中待识别的实体。
  • l提示学习通过使用人工设计提示模板 (prompt template) 和 答案模板 (answer template)使用预训练模型,在最近的几项NLP相关任务中取得了很好的效果。

科研问题:

  • 对网络安全威胁情报的即时分析是安全专家面临的一个挑战,因为每天生成的网络信息量无法估量。这就需要自动化的信息抽取工具来准确地抽取威胁情报所隐含的信息,继而构建网络安全三元组构建知识图谱来方便查询和检索数据。

提示学习:

宏观图景框架:

由于提示学习的特性,准备利用提示学习构建命名实体识别模型,构造命名实体识别模板,通过提示学习完成威胁情报句子中的实体类型。之后对于存在两个实体以上的句子利用提示学习方法来完成网络安全三元组的抽取。

2022-06-09组会报告摘要-01

本次组会汇报最近关于区块链项目以及论文的一些进展情况:

主要从科研背景、异常交易监测相关研究、方法、个人思考和总结几个方面展开介绍

科研背景

区块链交易存在各类异常交易,比如钓鱼攻击、ICO攻击等异常交易类型,这类交易和普通交易的问题存在以下差异:
交易品类
数字货币:去中心化
流通货币 :中心化
交易特点
流通货币:犯罪分子会尽可能地隐藏手机号、电子邮箱、银行账号等敏感信息来实施非法交易活动
数字货币:匿名性 无需使用以上敏感信息即可开展活动,提高了对违法犯罪活动的监测难度
交易机制
数字货币:基于加密算法进行研究

相关工作 目前针对异常交易检测的方法可以归纳为以下类别:

参考文献方法方法描述
基于聚类或者分类模型检测异常交易
2基于One Class SVM, K-means 应用交易特征行为分析,利用SVM分类出正常以及异常交易地址,并进一步检测出攻击类型;
5高斯混合模型根据交易分析用户特征,对用户进行分类并区分出正常用户或者异常用户;验证异常交易;
6基于机器学习异常交易检测算法使用“椭圆数据集”,使用各类机器学习算法验证检测比特币异常交易并选择合适的超参数。
基于网络特征分析的异常交易检测方法
8提出BTCOut检测算法融合“网络结构”+“属性”的相似性结构综合策略,衡量网络之间的特征,获取较好的特征挖掘效果;
9基于注意力机制的GNN模型综合交易网络的结构信息和交易记录中的时间信息,采用注意力机制细化网络结构,并捕获隐藏的时间特征以实现精确结果;
3基于特征融合的异常检测在交易网络中,融合自身特征以及相邻特征,基于交互关系形成的机制挖掘网络信息
基于随机游走网络嵌入的异常交易检测方法
1NetWalk通过学习网络拓扑结构特征,并动态更新网络结构并检测网络异常
10基于多重图和时间-金额游走 将交易记录构造成包含时间、金额的网络,并基于随机游走保留交易图中这两个重要属性,随后对向量化的图进行模型训练。

方法:

针对已有模型关键问题有

数据不平衡以及负采样问题这是目前可以迭代优化的地方

个人思考和总结

目前使用的是针对网络结构随机游走,目前效果较好的应用于属性-结构二部图网络学习模型等方法,可以作为进一步研究点。

2022-06-02 组会报告摘要-02

本次介绍的是自己对于基于联邦学习的异常流量检测的一些想法。

一、科研背景

随着网络技术的快速发展,各式各样的新型恶意攻击不断出现。网络异常流量检测是抵御恶意攻击、保护网络可用性和隐私安全的重要手段,对于维护网络安全有着至关重要的作用;
利用深度学习进行异常检测引起了广泛的研究,性能较好的深度学习模型的建立需要大量的数据样本。然而单一网络域内面临着数据不足、标注能力不够、且原始流量数据可能泄露域内的敏感信息和用户数据,因此难以训练出性能较好的异常检测模型。

传统的集中式模型训练方法需要用户将数据上传到服务器中,在服务器端实现数据收集、存储、模型训练,无法保证用户的数据隐私。联邦学习作为一种新的、隐私安全的机器学习框架,可以在各方不汇聚隐私数据的基础上共同训练模型。

二、科研问题

1、异常流量数据样本少,传统的集中式学习易造成用户隐私泄露。
2、参与联邦学习的用户数据量不平衡,容易造成较大的隐私预算。

三、科研目的

1、利用联邦学习框架解决网络流量样本少的问题;
2、针对客户端之间的不平衡数据,利用一种基于差分隐私的联邦学习(DP-FL)框架,设计了一种新颖的差分隐私卷积神经网络,采用自适应梯度下降(DPAGD-CNN)方法对新对每个用户的模型参数进行更新,提高隐私保护的性能。

四、研究内容

1、总体框架图

2、用户模型参数更新:

3、全局模型更新

2022-5-26 组会报告摘要-03

本次组会将会介绍关于基于深度强化学习的工作流任务云调度研究进度,主要内容如下

科研背景
近年来,云计算技术迅速发展,云服务供应商除了为用户提供强大的计算和存储资源,越来越多的功能如负载平衡,自动拓展等功能为应用开发提供了强有力的支持,使得云服务逐渐成为搭建应用程序的主流选择之一。随着越来越多的应用选择云环境,云服务调度的任务种类愈发复杂,同时,各类在线服务应用对云环境高效实时的任务调度需求不断增加。

科研问题:
如何实现云环境下对复杂任务的实时,高效,提供满足用户QoS要求的调度。

科研目的:
使用遗传算法和深度强化学习,通过遗传算法对workflow任务在虚拟机中子任务执行顺序的预处理,深度强化学习Q-learning算法进行智能调度,实现对workflow任务实时调度,并尽可能降低任务响应时间和虚拟机成本满足QoS要求。

整体框架:

2022-5-26 组会报告摘要-02

本次组会主要是对最近的论文复现以及改进的实验进度进行汇报,其主要内容如下:

【背景】

区块链作为核心技术自主创新重要突破口,加快推动区块链技术和产业创新发展。要加强对区块链技术的引导和规范,加强对区块链安全风险的研究和分析,密切跟踪发展动态,积极探索发展规律

随着区块链技术的快速发展,各种类型的网络犯罪层出不穷,以太坊已成为各种网络犯罪的温床。由于区块链的匿名性,犯罪分子试图通过向区块链系统注入资金来逃避监管和从事非法活动。据报道,以太坊遭遇了各种各样的诈骗,如黑客、网络钓鱼和庞氏骗局等。

【科研问题】

【科研目的】

设计一种基于时间加权多通道游走的区块链交易异常检测方法。

【整体框架】

【论文复现】

2022-5-19 组会报告摘要-02

科研背景:随着计算机网络和信息技术的高速发展,网络安全形势日趋严峻,大规模攻击日趋频繁。为了防范网络攻击,产生了很多的安全技术。入侵检测系统是继防火墙之后的第二道网络安全屏障,是一种主动的安全防护措施,有效弥补了防火墙的不足。虽然目前的入侵检测系统具有强大的攻击检测能力,但是多数的IDS仍然存在大量重复告警的问题,误报率偏高,告警质量低下,只能检测单步攻击行为,无法反映渗透的整体过程以及攻击者的攻击意图,使得安全管理人员难以管理和分析海量告警数据。

科研问题:如何降低IDS冗余告警带来的负面影响;现有的告警关联方法大多存在需要不同程度的专家知识。

科研目的:基于入侵检测系统根据网络实时流量输出的告警信息,构建网络基本事件图谱,减少冗余信息,降低处理时间复杂度。提出一种基于多因素的告警关联方法,方法核心在于通过结合时间、IP 地址、告警类型等多个因素来综合度量告警间的关系。

2022-5-12组会报告摘要01

科研背景

现有电动汽车充电桩推荐系统相关研究可主要分为两类:
一种是围绕配电网和充电设施,主要考察大规模充电行为对区域电网峰值可能造成的不利影响,通过优化区域调度或合理安排充电站位置,避免配电网出现超负荷运行的危险。
另一种是以用户的角度来做出判断,考虑在当前时空环境下,最佳的充电站选择。结合用户的出行特点、车辆的具体配置、用户的个性化需求以及为享受充电服务付出的时间成本、经济成本等诸多因素,对衡量最佳充电站的目标函数进行优化。

近几年,区块链技术已被应用于车辆数据管理场景中,以便不仅解决安全和隐私问题,而且在边缘节点之间建立信任。
[21]中介绍的工作利用了财团区块链,并开发了一种基于信誉的数据共享方案,使车辆能够选择具有高质量数据的最佳和更可靠的数据源。区块链还成功应用于智能交通系统(ITS)中的安全车辆数据共享。
[22]中介绍了一种基于区块链和密码技术的多媒体数据共享方法,该方法可部署在车辆社交网络中。该方法采用区块链,以利用其不变性特征来应对恶意共享多媒体数据篡改的挑战。

科研问题:

在传统的框架中存在的服务可信问题:
1.如何保障车辆上传数据的可用性;
2.如何保障车辆位置隐私信息的安全性。

解决方案

进度报告:

1)优化模型:采用多目标优化的方法确定目的充电桩,从车辆行驶距离与车辆等待时间两大方面进行优化,优化目标函数为:

2)整体架构:

3)隐私保护机制:

用户在参与推荐过程中时,首先要确认自身的隐私保护级别∂。在本文提出的电动汽车充电桩推荐系统中,共有两个隐私保护级别。其中低级别为不进行隐私保护,直接将自身位置信息上传至系统中参与推荐;高级别则需要采用K-means算法隐藏自身实际的位置信息。

4)工作流

研究计划

时间任务
5.11-5.18完善实验并完成实验图表
5.19-6.1完成论文初稿
6.1-6.8修改论文,争取在六月份投递

2022-05-12 组会报告摘要-03

基于知识的虚假信息检测

科研背景

  • 近年来,随着社交媒体与社交平台的发展与普及,极大地改善了人们的生活质量,改变了人们对于信息的获取方式。然而,谣言、骗局、阴谋论等虚假信息的泛滥给社交网络和现实世界产生了恶劣的社会影响。因此,虚假信息检测作为目前热门的一个研究领域,受到了极大的关注。
  • 对于网络上存在的大量信息进行人工核查显然是不现实的。因此如何利用模型进行自动的虚假信息检测且检测结果具有较高的准确性是目前研究的一个热点。

科研问题

  • 一些信息并不能直接判断出其真假,或者信息包含的内容较少,需要借助外部文本来进行辅助判断。如何从大量的外部文本中找到有用的内容并融合到虚假信息检测中是目前研究存在的一个问题。
  • 文本的语义是复杂的,一个词语在不同的语境下可能具有不同的含义。如何对词语在不同语境下进行恰当的表示也是应该考虑的问题。 目前许多的自然语言处理任务都会使用预训练语言模型,但单纯依靠大规模的文本的预训练语言模型可能还是很难理解复杂的问题,那么如果加入充分的先验知识,也许模型会学习到更加精细化的语义表示。

整体思路

提出融入非结构化的文本和结构化的知识图谱来提高虚假信息检测的准确率。