2022-02-24组会报告摘要-01

本次组会介绍阅读的一篇论文《Contextualized Weak Supervision for Text Classification》,主要从以下几个方面展开介绍:


1. 介绍理由
主题是弱监督文本分类;
发表在顶刊, 比较权威;
有开源代码;
是看过的第一篇论文的引用论文, 同时引用了看过的第二篇论文


2. 科研背景
有标签的数据获得成本高
有监督学习可以获得更好的训练效果
但是
已有的弱监督框架:
生成伪标签
学习文档与标签的映射关系
扩展用户提供的类别关键字


3. 科研问题
同一个词在不同的上下文环境下将表示不同的含义, 考虑上下文之后可以获得更好的训练效果


4. 方法