2021-12-16组会报告摘要-03

本次组会将会介绍阅读的一篇论文《CE-FPN: Enhancing Channel Information for Object Detection》,主要从以下几个方面介绍:

研究背景:

由于深度学习可以利用庞大丰富的数据,对数据进行处理后送入网络中进行训练,提取同一目标丰富的特征来完成模型的训练。因此,深度学习相较于传统的视觉检测,算法的健壮性更好,鲁棒性和泛化性更强,更易于应用于特征复杂多变环境下的对象检测任务。

特征金字塔网络(FPN)是在目标检测中提取多尺度特征的一种有效框架,基于FPN的方法通过将多尺度特征与浅层内容的描述性特征和深度语义特征相结合,大大提高了目标检测的性能。

科研问题:

目前基于FPN的方法大多存在通道减少的内在缺陷,这导致了语义信息的丢失。而各种融合的特征图可能会造成严重的混叠效应。

方法:

本文提出了一种新的通道增强特征金字塔网络(CE-FPN),它具有三个简单而有效的模块来缓解这些问题。具体来说,受亚像素卷积的启发,我们提出了一种亚像素跳跃融合方法来执行通道增强和上采样,来代替原来的1×1卷积和线性上采样,它减轻了由于通道减少而造成的信息损失。然后,我们提出了一种用来提取更多特征表示的亚像素(sub-pixel)上下文增强模块,由于亚像素卷积利用了丰富的通道信息,因此优于其他上下文方法。此外,还引入了一个通道注意力引导模块来优化每个特征层上最终的集成特征,这仅用了少量的计算负担,就减轻了混叠效应(aliasing effect)。

总体框架: