DetNet详解(很详细!!!一看就懂系列!!!!!!)

DetNet详解(很详细!!!一看就懂系列!!!!!!)

DetNet详解

DetNet由旷视科技发表在ECCV2018的论文,出发点为现有的检测任务的backbone网络都是由分类任务衍生而来,因此作者想针对检测专用的backbone网络做一些讨论和研究而设计的DetNet。

1.很多backbone网络在ImageNet大赛上做分类表现不错,才被人当作检测的主干特征提取网络(backbone),鲜有单独针对检测任务提出的backbone。

检测和分类有明显的区别:(1)不仅需要分类,还需要精确的定位。(2)检测器都是类似FPN结构,在分类网络基础上额外多尺度特征进行检测,应对不同尺度变化的目标。这两点又是相互补充,共同协助网络从分类到检测的转变。例如分类任务是检测任务中必不可少的一环,但是传统分类采用的最高级特征定位细节不够,因此很多网络没法用类似FPN结构去处理尺度变化的问题,就将分类较好地过渡到检测任务上了。

2.DetNet主要解决的问题

1.主要着眼点是分辨率,从大目标和小目标分别阐述保持分辨率的重要性,因此DetNet也是从保持分辨率着手,解决多尺度物体的识别问题。

2.网络在较深层处容易导致大目标的边界不明确使精确定位困难

3.下采样会导致小目标的消失,只要能避开下采样就能防止物体目标丢失,但是这种方法又会导致抽象能力不够。

3.DetNet是如何设计的?

保持分辨率有两个麻烦的问题:(1)内存消耗大,计算大(2)下采样减少导致高层的抽象特征不足以很好地进行分类任务,因此设计的时候会考虑时间和高层特征两点。

下图为DetNet和FPN,分类backbone网络结构的对比,可以看到DetNet backbone中第一个16x后尺寸不变了,也就是说保持了分辨率。

具体实现细节如下:

(1)采用ResNet50为backbone,改进设计了DetNet-59 (2)对bottlenecks进行了改进,传统的其实不止是C,也包含AB,即将AB的膨胀卷积换成普通卷积。点击详细了解膨胀卷积 (3)为了减少分辨率保持带来的时间和内存成本的消耗,通道数固定为256 (4)DetNet可以加入FPN结构,方法类似。

3.DetNet在分类和检测任务上的表现

分类任务

(1)在FPN基础上明显有大物体涨点,同时由于高分辨率,小物体也有不错的提升。

(2)膨胀卷积提供的大感受野使得分类也不逊色

检测任务

(1)从AP50看出,高好1.7;从AP80看出,高了3.7。由此可以看出确实提高了检测性能。 (2)从定位性能来看,大物体的提升比小物体更多。作者认为是高分辨率解决了大物体边界模糊的问题。其实有一种解释:小目标没有大目标明显,因为膨胀卷积核降采样都会丢失小目标,只是膨胀卷积可能离散采样不至于像降采样直接给到后面没了,但是没有根本性的解决,所以小目标不大。 (1)AR50体现了小目标的查全率更好,这也印证上面分析的:相对降采样,膨胀卷积丢失会好点。此下大目标效果虽然提升不大但是也很高了,作者表示DetNet擅长找到更精确的定位目标,在AR85的高指标就能看出。 (2)AR85看大目标丢失少,说明能够像 VGG一样对大目标效果优良。关于小目标的效果平平,作者认为没有必要太高,因为FPN结构对小目标已经利用地很充分了,这里即使不高也没事。

✧ 相关推荐 ✧

《dnf》瞎子关闭二觉被动
365怎么访问

《dnf》瞎子关闭二觉被动

📅 07-05 👁️ 8460
台式机主机内部结构 台式机主机有哪些配件组成【详细介绍】
畴字取名的寓意是什么?
365怎么访问

畴字取名的寓意是什么?

📅 09-27 👁️ 9354