【目标检测】YOLO和SSD的区别

机器不学习我学习

已于 2022-03-02 11:29:36 修改

阅读量7.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：目标检测文章标签：目标检测

于 2020-09-07 11:35:09 首次发布

34 篇文章

订阅专栏

这里的YOLO是指YOLO v1算法。

主要思想（key idea）：

将物体检测这个问题定义为bounding box和分类置信度的回归问题。
将整张图像作为输入，划分成SxS grid（7×7网格），每个cell（格子）预测B个bounding box（x, y, w, h）及对应的分类置信度（class-specific confidence score）。分类置信度是bounding box是物体的概率及其与真实值IOU相乘的结果。

优点：

缺点：

主要思想（key idea）：

优点：

缺点：

需要人工设置prior box的min_size，max_size和aspect_ratio值。网络中prior box的基础大小和形状不能直接通过学习获得，而是需要手工设置。而网络中每一层feature使用的prior box大小和形状恰好都不一样，导致调试过程非常依赖经验。
虽然采用了pyramdial feature hierarchy的思路，但是对小目标的recall依然一般，并没有达到碾压Faster R-CNN的级别。作者认为，这是由于SSD使用conv4_3低级feature去检测小目标，而低级特征卷积层数少，存在特征提取不充分的问题。

YOLO在卷积层后接全连接层，即检测时只利用了最高层Feature maps（包括Faster
RCNN也是如此）而SSD采用金字塔结构，即利用了conv4-3/fc7/conv6-2/conv7-2/conv8_2/conv9_2这些大小不同的feature maps，在多个feature maps上同时进行softmax分类和位置回归。
SSD加入了Prior box。