2021-12-23 组会报告摘要-03

本次组会将会介绍阅读的一篇论文《Attentive History Selection for Conversational
Question Answering》
,主要从以下几个方面介绍:

科研背景

随着会话式AI的快速发展,产生了各种个人助理产品,例如Apple Siri,Amazon Alexa,Google Assistant等。越来越多的用户依赖这些系统来进行日常工作,比如设置计时器或下订单。一些用户还与它们互动娱乐,甚至作为情感伴侣。

对话问答场景

一个典型的对话问答过程涉及多个轮次。在每一轮中,用户首先指定一个信息需求,然后机器(代理)检索答案并返回给用户。用户可以问一个后续的问题,或转移到一个新的信息需求,进入对话问答的下一轮。其中存在几种不同的情况:

  • 用户的问题与上一轮的回答相关,例如A1和Q2,A3和Q4,A4和Q5,A5和Q6。
  • 用户的问题与之前的轮次无关,例如A2和Q3。——话题转移
  • 用户的问题与很早之前轮次的相关,例如Q7和Q1。——话题返回

科研问题

虽然目前的个人助理系统能够完成任务,甚至进行聊天,但它们无法处理需要多次交互的复杂信息需求的信息寻找对话。

对话问答的主要挑战之一是利用对话历史来理解和回答当前的问题,但存在以下的问题:

  • 机器不能像人一样自主理解历史对话信息。
  • 如果我们把历史对话信息以同样的地位/权重放入模型中可能效果并不是很好。
  • 现有模型采用简单的启发式选择对话历史,假设前一轮次比其他轮次更有帮助。但这种假设不一定正确。 [1]对QuAC数据集进行了定性分析。他发现35.4%和5.6%的问题分别有话题转移话题返回的对话行为。在这两种情况下,当前的问题都与前一回合没有直接关系。

方法

本文从三个方面来解决对话问答存在的问题:

  • 提出一种历史答案嵌入方法,利用Bert对包含位置的对话历史信息进行自然编码。
  • 设计了一种历史注意机制(HAM)来进行对话历史的“软选择”。
  • 利用多任务学习在进行答案预测的同时进行另一个重要的会话任务(对话行为预测)。

模型

2021.12.23组会报告摘要01

本次将会介绍有关《基于小波变换和CNN-GRU的网络异常流量检测》的进展情况。主要内容如下:

科研背景:

随着计算机网络通信技术的飞速发展,计算机网络之间需要传输大量信息,为了提高网络资源的传输效率,掌握网络运行规律和异常网络状态,有必要对网络流量进行分析和预测,以便更有效地进行网络安全监控和安全评估。同时也出现了一系列攻击,网络入侵检测的任务是发现可疑攻击,并采取相应措施保护网络免受持续攻击,减少经济损失。流量分类是网络入侵检测的一项重要任务。

科研问题:

1.网络流量是非平稳数据,存在突变的几率高,现有的模型在数据突变时,应对能力不强。

2.网络流量存在周期性,忽略周期性带来的影响,可能会使预测精度下降。

3.现有的异常流量检测方法在时间和空间维度的结合较少。

科研目的:

提出一个基于小波变换和CNN-GRU的网络异常流量检测模型,该模型:

1.采用小波变化,小波对于突变信号的灵敏度很高,适合处理像网络流量这样的非平稳数据,能够提高在数据突变时预测的精度。

2.将一段时间内的数据视为整体,令数据从1D转化2D,利用CNN学习周期性的特征,作为异常流量监测判断的一个因素。

3.利用神经网络提取网络流量空间、时间上的特征。

实验流程:

未来计划:

预测模块:周期划分部分,学习特征,对于数据进行对比,精度不高,仍需要修改进行完善。

分类模块:计划考虑效率问题,现有数据维度过多,模型训练较慢,消耗资源大,而每一类攻击只会在某几类维度中有较为明显的特征,学习出每一类攻击对应最为凸显的几个维度进行模型训练,可以提高效率,但是现在只是出于计划阶段。

2021-12-23组会报告摘要-02

本次组会将会介绍阅读的一篇论文《EXTRACTOR: Extracting Attack Behavior from Threat Reports》,主要从以下几个方面介绍:

研究背景

随着如今互联网网络服务不断趋于智能化,网络攻击方式日益隐蔽复杂,面对越来越多的网络安全威胁,网络威胁情报已然成为近几年国内外安全领域的热点。通过对网络威胁情报的获取、分析和共享,企业、组织和安全人员能够快速获取新的入侵威胁指标及其他更详细的信息,以此来识别、阻断和追踪网络入侵者,并能够预防更多网络威胁。CTI报告通常含有大量的无关的文本,安全人员很难从大量的文本中提取出真正有效的信息,因此利用工具自动从CTI文本中提取攻击信息有一定的研究价值。

科研问题

从威胁报告中提取攻击行为信息当前面临着三个主要的问题:

(1)在一整篇CTI报告中,描述在系统审计日志能观测到的攻击行为可能只占很小一部分。CTI攻击信息提取器需要将有用的,能在系统审计日志中观测到的信息从不必要的冗余信息中提取出来。

(2)在网络空间安全领域中使用的语言具有很强的专业性,这使得传统的自然语言处理工具十分难以理解。

(3)对CTI报告中全局的信息进行提取需要理解攻击行为之间的关系,目前类似的提取方法仅仅依赖于句子的句法结构,没有考虑句子中实体之间的语义关系。

方法

本文提出了EXTRACTOR用于解决这些问题。EXTRACTOR的目标是以图的形式描述CTI报告中攻击行为的全局信息。EXTRACTOR包含四个部分:Normalization;Resolution;Summarization;Graph Generation。前两部分主要用于解决文本复杂度与专业性问题,第三部分用于解决文本冗长问题,最后一部分用于提取攻击实体及其之间的关系。

结论

本文设计了一个自动提取CTI报告中攻击信息的工具EXTRACTOR。EXTRACTOR可以有效地提取CTI报告中的攻击信息,提取出的攻击信息以起源图的形式展示,且生成的起源图与人工生成的起源图能够进行匹配。生成的起源图能够进一步地作为威胁检测系统的输入。

2021-12-16 组会报告摘要-02

本次将会介绍有关《基于零知识证明的异构架构联邦学习安全聚合方法研究》的进展情况。其中主要内容包括:

科研背景

联邦学习支持在不损害多个参与者的数据隐私的情况下,创建强大的集中式模型。由于知识产权问题以及任务和数据的异构性,每个参与者独立设计自己的模型在实际应用中具有广泛的需求。在面临数据中毒攻击、模型中毒攻击以及推理攻击时,异构架构联邦学习的鲁棒性和隐私性同样会受到威胁。因此,增强异构架构联邦学习的鲁棒性及隐私性是非常有意义的研究方向。

科研问题

1.大多数隐私性和鲁棒性研究都集中在同质架构下的联邦学习上,目前尚不清楚现有的攻击、隐私保护技术和防御机制是否适用于异构体系结构的联邦学习;

2.现有的针对于联邦学习隐私性和安全性的防御措施,要么需要检查培训数据,要么在服务器上完全控制培训过程,由于联邦学习需要对节点数据隐私进行保护,因此其中任何一种方法都难以在联邦学习环境中有效。

科研目的

1.研究数据中毒攻击、模型中毒攻击、推理攻击等在异构架构联邦学习下的攻击效果以及对应的防御措施;

2.研究零知识证明在异构架构联邦学习系统中的应用,提出一种基于零知识证明的安全聚合方法。

实验流程

实验进展

1.构建威胁模型(非目标中毒攻击)

公共数据集投毒

私有数据集投毒

2.实现零知识证明

原理:每个参与方必须提供一个非交互式零知识证明,证明其提交的更新类分数格式正确,并且有一个以服务器设置的边界的范数(范数可使用公共数据集计算或采用中值等方法)。若验证成功,进行更新步骤;若失败,将该参与方排除在本次更新之外,计算其他正确参与方提供的类分数更新。

步骤:编写计算的验证逻辑;生成证明密钥(proving key)和验证密钥(verification key);参与方使用proving key和可行解构造证明;服务端使用verification key和构造证明,验证参与方发过来的证明。

开源库libsnark:C++ library for zkSNARKs

2021-12-16组会报告摘要-03

本次组会将会介绍阅读的一篇论文《CE-FPN: Enhancing Channel Information for Object Detection》,主要从以下几个方面介绍:

研究背景:

由于深度学习可以利用庞大丰富的数据,对数据进行处理后送入网络中进行训练,提取同一目标丰富的特征来完成模型的训练。因此,深度学习相较于传统的视觉检测,算法的健壮性更好,鲁棒性和泛化性更强,更易于应用于特征复杂多变环境下的对象检测任务。

特征金字塔网络(FPN)是在目标检测中提取多尺度特征的一种有效框架,基于FPN的方法通过将多尺度特征与浅层内容的描述性特征和深度语义特征相结合,大大提高了目标检测的性能。

科研问题:

目前基于FPN的方法大多存在通道减少的内在缺陷,这导致了语义信息的丢失。而各种融合的特征图可能会造成严重的混叠效应。

方法:

本文提出了一种新的通道增强特征金字塔网络(CE-FPN),它具有三个简单而有效的模块来缓解这些问题。具体来说,受亚像素卷积的启发,我们提出了一种亚像素跳跃融合方法来执行通道增强和上采样,来代替原来的1×1卷积和线性上采样,它减轻了由于通道减少而造成的信息损失。然后,我们提出了一种用来提取更多特征表示的亚像素(sub-pixel)上下文增强模块,由于亚像素卷积利用了丰富的通道信息,因此优于其他上下文方法。此外,还引入了一个通道注意力引导模块来优化每个特征层上最终的集成特征,这仅用了少量的计算负担,就减轻了混叠效应(aliasing effect)。

总体框架: