本文是论文<Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift>的阅读笔记,该论文提出了Batch Normalization (BN),通过减小Internal Covariate shift,提升模型效果。在GoogLeNet中加入BN,达到分类任务的SOTA。
本文是论文<Rethinking the Inception Architecture for Computer Vision>阅读笔记,该论文提出了Inception v2和Inception v3,提出了标签平滑(LSR)技术、卷积核的非对称分解、网络的4个通用设计原则等。最后基于Pytorch实现。
本文是我学习ROS的笔记,介绍了如何通过命令行从零创建一个功能包:基于roscpp的Service通信和基于rospy的topic通信。
本文通过对turtlesim实现乌龟跟随,学习ROS中坐标转换(TF)的概念和使用方法。
本文是论文<Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition>的阅读笔记,该论文提出了空间金字塔池化(SPP),SPP-net,改进了RCNN。获得了VOC2007的SOTA,以及ILSVRC2014目标检测第二名和图像分类第三名。
本文是论文<Fast R-CNN>的论文阅读笔记,该论文在SPPNet和RCNN的基础上改进,提出了Fast RCNN,速度更快精度更高,而且将回归器,分类器,特征提取器整合为一个整体,提出RoI池化,使用SVD分解FC层,模型达到目标检测的SOTA。
本文是论文<Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks>的阅读笔记,该论文提出了RPN,与Fast RCNN融合成端对端的目标检测网络 Faster RCNN,在VOC 2007,2012,MS COCO上达到SOTA。
本文是论文<You Only Look Once: Unified, Real-Time Object Detection>的阅读笔记,该论文提出了YOLO v1,是一个single-stage目标检测模型,直接从图像回归bbox。运行速度快,可是实现实时检测,精度高,能学到全局信息,泛化能力强。