2022年11月10日 组会报告摘要-03

本次组会汇报内容是关于基于提示学习的命名实体识别研究进展情况,从科研背景、科研问题、科研目的、整体框架和研究计划等几个方面展开。

科研背景:

  • l由于攻击或者恶意软件的变种层出不穷,为了应对这些攻击或者恶意软件而产生的网络威胁情报也与日俱增。随之而来的是各种专有名词不断涌现,而且普遍存在大量的缩写词,当前实体识别使用的大多是fine-tuning 预训练模型的方法,难以界定实体的边界。
  • 作为信息提取任务的基本组成部分,命名实体识别在自然语言处理 (NLP) 任务中发挥着非常重要的作用。命名实体识别(NER)任务由两部分组成:识别实体类型和检测实体边界。实体边界检测是指确定一个实体的范围。识别实体类型是将相应类别的标签赋予文本中待识别的实体。
  • 提示学习在不显著改变预训练语言模型结构和参数的情况下,通过向输入增加“提示信息”、将下游任务改为文本生成任务,预训练语言模型以参数的形式存放很多知识和模式,有的是现成的、可以直接使用,有的则需要一定的方法来“激发”出来。

科研问题:

  • l构建信息抽取工具来解决网络安全威胁情报的即时分析问题[Sudip Mittal,2016;Hashimoto C,2020]。
  • 如何识别专有名词、缩写词以及界定实体的边界。

整体框架:

研究计划:

1.11月20号底前完善实验

2.11.18之前完成毕业论文绪论、相关基础理论的初稿