本次组会汇报关于基于知识图谱的网络安全威胁情报推理技术研究的思路进展,从科研背景、科研问题、科研目的、研究内容等几个方面展开。
科研背景
- 随着信息化不断扩大以及网络技术的持续发展,网络安全事件频发,网络攻击手段也日益呈现复杂多变、长持续性、高隐蔽性等特点。依靠传统的入侵防御系统等被动防御手段无法有效地维护网络空间安全,因此兴起了网络安全威胁情报(CTI)等综合防御策略。网络安全威胁情报是指基于证据的威胁知识,可以为决策提供信息,目的是防御攻击或缩短处理与检测的时间。
- 网络安全威胁情报在实际应用中主要面临着数据类型多样、分布离散、内容不一致等问题,因此引入了知识图谱技术框架来试图解决这一问题。将知识图谱作为外部知识进行知识增强可以有效提升下游任务的效果。
- BERT等预训练语言表示模型在多个NLP任务中取得了不错的表现。同时,一些研究人员正在将BERT应用到专业领域,例如军事、农业等。然而,由于通用语料库缺乏专业领域知识,这些模型在特定领域表现不佳。
科研问题
- 威胁情报在实际应用过程中存在使用多个数据源、海量数据的难以处理的问题
- 由于网络安全威胁情报存在大量网络安全术语,对于文本分类任务,使用通用的BERT模型表现欠佳。
科研目的
- 将网络安全威胁情报知识图谱作为领域知识整合到语言模型中,使得模型有更好的可解释性,提高模型的性能。
研究内容
- 基于知识图谱的网络安全威胁情报推理技术研究