本文是论文<CBAM: Convolutional Block Attention Module>的阅读笔记,该论文提出了实现视觉注意力机制的模块CBAM(或称SAM)。CBAM可解耦为通道注意力和空间注意力,可与现存的网络结合,在图像分类和目标检测上达到SOTA效果。
本文是论文<CSPNET: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN>的阅读笔记,该论文提出了CSPNet,通过在增加一条梯度流通路在减小backbone计算量的同时提高了模型的学习能力。
本文是论文<Path Aggregation Network for Instance Segmentation>的阅读笔记,该论文提出一个实例分割/目标检测算法PANet。PANet在FPN的基础上增加了一个自底向上的架构,同时提出了自适应特征池化方法,融合预测分割掩码,最终在获得COCO 2017实例分割比赛第一名。
本文是论文<Densely Connected Convolutional Networks>的阅读笔记,该论文提出了DenseNet架构。DenseNet有几个优点:缓解了梯度消失问题,增加了特征传播,鼓励特征重用,极大减小了特征参数。在各个方面均超越了ResNet。
本文是论文<Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning>的阅读笔记,该论文在Inception-v3的基础上提出了Inception-v4,并将Inception架构和残差网络结合,提出Inception-ResNet-v1和Inception-ResNet-v2网络。
本文是论文<Xception: Deep Learning with Depthwise Separable Convolutions>的阅读笔记,该论文基于Inception模块和深度可分离卷积,提出了深度卷积神经网络:Xception。Xception的参数量与Inception V3差不多但是精度胜过了。
本文是论文<MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications>的论文笔记。该论文提出了一个轻量级的骨干网络:MobileNet,该网络在深度可分离卷积的基础上构建。实验表明该网络在大幅提升速度、减小模型的情况下可以达到经典网络的精度。
本文是论文<YOLOv3: An Incremental Improvement>的阅读笔记,该论文在YOLOv2的基础上提出YOLOv3,做了一些小改动,还提出了新的backbone网络:Darknet-53。YOLOv3的速度很快,而且其AP50精度几乎达到SOTA。
本文是论文<YOLO9000:Better, Faster, Stronger>的阅读笔记,该论文提出了分类模型Darknet-19,基于YOLOv1提出目标检测模型YOLOv2,YOLO9000。YOLOv2比Faster R-CNN、SSD精度差不多,但是速度更快。YOLO9000可以检测超过9000类目标。
本文是论文<Deformable Convolutional Networks>的阅读笔记,该论文提出了可变形卷积(Deformable convolation)和可变形RoI池化这两个模块,借鉴了STN的思路,提高了CNNs建模几何形变的能力。实验展示了可变形卷积提高了目标检测和语义分割的精度,而仅需很小的代价。