2022-01-20 组会报告摘要-03 | 电力大数据研究院

本次组会将进行《网络安全威胁情报文本信息抽取研究》研究进展情况，并且报告接下来要进行实验的内容，其主要内容如下:

科研背景：

网络威胁情报利用收集、完善和分析收集到的网络攻击信息来应对网络空间领域中存在的威胁[Brown R，2019]。
知识图谱以结构化图的形式描述客观世界中概念、实体及其关系属性，便于机器更好的建模、理解和推理。
网络安全知识图谱通过三元组的形式存储了大量网络威胁信息,对于帮助安全分析师检测网络威胁至关重要。它可以帮助在“安全运营中心”（SoC）工作的安全分析师及时对网络攻击进行响应，并提供防御决策时信息支持。

科研问题：对网络安全威胁情报的即时分析是安全专家面临的一个挑战，因为每天生成的网络信息量无法估量，这就需要自动化的信息抽取工具来方便查询和检索数据。所以如何准确、高效地抽取威胁情报所隐含的信息是要解决的科研问题。

科研目的：l针对收集到的威胁情报，可以识别出威胁情报句子中的实体类型，并提取出不同实体之间存在的关系。

研究的宏观图景框架：

针对整体研究框架，在后续的报告中报告该框架中的实验以及实验中的参数、模型、数据集等情况，并分析实验结果。

下一步计划：

针对下一步的研究计划，准备引入激励学习（promet learning）中的OpenPrompt框架和命名实体识别中的MRC（machine reading comprehension）框架来提高命名实体识别的准确率，并介绍激励学习和MRC的任务定义和主要思想。