常晓雨 | 电力大数据研究院

本次组会将会介绍阅读的一篇论文《Dynamic Knowledge Graph Alignment》，主要从以下几个方面介绍：

科研背景

研究者通常根据实际需求构建知识图谱，造成单一知识图谱信息覆盖率低的问题，无法满足不同领域知识图谱的应用需求。知识融合是充分利用现有知识图谱，提高知识图谱信息覆盖率的主要途径。实体对齐是最常用的知识融合方法，一般用来从不同知识图谱中找到指向现实世界同一对象，并建立对象之间的关联关系。

科研问题

作者表示，现有对齐方法普遍假定知识图谱是静态的，而事实上知识图谱应该是处于一个更新和发展的过程中。基于此，论文提出了一个扩展的对齐任务：动态图谱对齐。

方法

作者认为该任务的难点在于实体嵌入的更新，因为知识图谱更新后拓扑结构也会随之变化，而实体嵌入与图谱结构高度相关。所提方法DINGAL-系列的核心思路是将知识图谱表示学习使用的GCN参数矩阵视作特征转换操作，从而减少转换和聚合过程间的耦合。

结果

实验对比现有14种对齐模型取得了性能超越，并且系列算法取得了更快的运行速度。

本次组会将会介绍阅读的一篇论文《EXTRACTOR: Extracting Attack Behavior from Threat Reports》，主要从以下几个方面介绍：

研究背景：

随着如今互联网网络服务不断趋于智能化，网络攻击方式日益隐蔽复杂，面对越来越多的网络安全威胁，网络威胁情报已然成为近几年国内外安全领域的热点。通过对网络威胁情报的获取、分析和共享,企业、组织和安全人员能够快速获取新的入侵威胁指标及其他更详细的信息,以此来识别、阻断和追踪网络入侵者,并能够预防更多网络威胁。CTI报告通常含有大量的无关的文本，安全人员很难从大量的文本中提取出真正有效的信息，因此利用工具自动从CTI文本中提取攻击信息有一定的研究价值。

科研问题：

从威胁报告中提取攻击行为信息当前面临着三个主要的问题：

（1）在一整篇CTI报告中，描述在系统审计日志能观测到的攻击行为可能只占很小一部分。CTI攻击信息提取器需要将有用的，能在系统审计日志中观测到的信息从不必要的冗余信息中提取出来。

（2）在网络空间安全领域中使用的语言具有很强的专业性，这使得传统的自然语言处理工具十分难以理解。

（3）对CTI报告中全局的信息进行提取需要理解攻击行为之间的关系，目前类似的提取方法仅仅依赖于句子的句法结构，没有考虑句子中实体之间的语义关系。

方法：

本文提出了EXTRACTOR用于解决这些问题。EXTRACTOR的目标是以图的形式描述CTI报告中攻击行为的全局信息。EXTRACTOR包含四个部分：Normalization；Resolution；Summarization；Graph Generation。前两部分主要用于解决文本复杂度与专业性问题，第三部分用于解决文本冗长问题，最后一部分用于提取攻击实体及其之间的关系。

结论

本文设计了一个自动提取CTI报告中攻击信息的工具EXTRACTOR。EXTRACTOR可以有效地提取CTI报告中的攻击信息，提取出的攻击信息以起源图的形式展示，且生成的起源图与人工生成的起源图能够进行匹配。生成的起源图能够进一步地作为威胁检测系统的输入。

电力大数据研究院

科研

作者归档：常晓雨

2022-02-24组会报告摘要02

2021-12-23组会报告摘要-02