AI 人工智能新闻资讯: 从R-CNN到YOLO，一文带你了解目标检测模型

2018年5月22日星期二

从R-CNN到YOLO，一文带你了解目标检测模型

这是一份详细介绍了目标检测的相关经典论文、学习笔记、和代码示例的清单，想要入坑目标检测的同学可以收藏了！

R-CNN

R-CNN是2014年出现的。它是将CNN用于对象检测的起源，能够基于丰富的特征层次结构进行目标精确检测和语义分割来源。

如何确定这些边界框的大小和位置呢？R-CNN网络是这样做的：在图像中提出了多个边框，并判断其中的任何一个是否对应着一个具体对象。

Fast R-CNN

2015年，R-CNN的作者Ross Girshick解决了R-CNN训练慢的问题，发明了新的网络Fast R-CNN。主要突破是引入感兴趣区域池化（ROI Pooling），以及将所有模型整合到一个网络中。

你可以通过以下GitHub链接查看模型的各种实现代码：

https://ift.tt/1zxPPb4

https://ift.tt/2b8mLAA

https://ift.tt/2GIgeY8

https://ift.tt/2IGeUec

https://ift.tt/2s3VxR1

这里还有一个利用对抗学习改进目标检测结果的应用：

https://ift.tt/2kggAwh

https://ift.tt/2p6qD8m

Faster R-CNN

2015年，一个来自微软的团队（任少卿，何恺明，Ross Girshick和孙剑）发现了一种叫做"Faster R-CNN"的网络结构，基于区域建议网络进行实时目标检测，重复利用多个区域建议中相同的CNN结果，几乎把边框生成过程的运算量降为0。

你可以在这里看到关于Faster R-CNN的更多介绍，包括PPT和GitHub代码实现：

https://ift.tt/2aMqHnr

Matlab

https://ift.tt/1UQH5Xt

Caffe

https://ift.tt/1LHmLNq

MXNet

https://ift.tt/2s3VDbl

PyTorch

https://ift.tt/2AYwEMF

TensorFlow

https://ift.tt/2kO6wwj

Keras

https://ift.tt/2t0hNNn

C++

https://ift.tt/2tRe6tV

SPP-Net（空间金字塔池化网络）

SPP-Net是基于空间金字塔池化后的深度学习网络进行视觉识别。它和R-CNN的区别是，输入不需要放缩到指定大小，同时增加了一个空间金字塔池化层，每幅图片只需要提取一次特征。

YOLO模型

YOLO是指标准化、实时的目标检测。

可以先看大数据文摘翻译的这个视频了解YOLO：

TED演讲 | 计算机是怎样快速看懂图片的：比R-CNN快1000倍的YOLO算法

有了YOLO，不需要一张图像看一千次，来产生检测结果，你只需要看一次，这就是我们为什么把它叫"YOLO"物体探测方法（You only look once）。

代码实现：

https://ift.tt/22oYiHP

https://ift.tt/2aMsTei

https://ift.tt/2aMrlkx

https://ift.tt/2b8nfqs

https://ift.tt/2kehbhV

YOLOv2模型

时隔一年，YOLO作者放出了v2版本，称为YOLO9000，并直言它"更快、更高、更强"。YOLO v2的主要改进是提高召回率和定位能力。

各种实现：

Keras

https://ift.tt/2kuQVNK

PyTorch

https://ift.tt/2mME1jd

Tensorflow

https://ift.tt/2tBeVFs

Windows

https://ift.tt/2i7CeT1

Caffe

https://ift.tt/2GC4HcJ

YOLOv3模型

再次改进YOLO模型。提供多尺度预测和更好的基础分类网络。相关实现：

https://ift.tt/2mvghgY

https://ift.tt/22oYiHP

https://ift.tt/2keeM6J

https://ift.tt/2s3OGH6

SSD（单网络目标检测框架）

SSD可以说是YOLO和Faster R-Cnn两者的优势结合。相比于Faster R-Cnn，SSD的目标检测速度显著提高，精度也有一定提升；相比YOLO，速度接近，但精度更高。

DSOD（深度监督目标检测方法）

与SSD类似，是一个多尺度不需要proposal的检测框架，是一种完全脱离预训练模型的深度监督目标检测方法。

机器知心

AI 人工智能新闻资讯