2018年5月22日星期二

从R-CNN到YOLO,一文带你了解目标检测模型

这是一份详细介绍了目标检测的相关经典论文、学习笔记、和代码示例的清单,想要入坑目标检测的同学可以收藏了!

R-CNN

R-CNN是2014年出现的。它是将CNN用于对象检测的起源,能够基于丰富的特征层次结构进行目标精确检测和语义分割来源。

如何确定这些边界框的大小和位置呢?R-CNN网络是这样做的:在图像中提出了多个边框,并判断其中的任何一个是否对应着一个具体对象。

Fast R-CNN

2015年,R-CNN的作者Ross Girshick解决了R-CNN训练慢的问题,发明了新的网络Fast R-CNN。主要突破是引入感兴趣区域池化(ROI Pooling),以及将所有模型整合到一个网络中。

你可以通过以下GitHub链接查看模型的各种实现代码:

https://ift.tt/1zxPPb4

https://ift.tt/2b8mLAA

https://ift.tt/2GIgeY8

https://ift.tt/2IGeUec

https://ift.tt/2s3VxR1

这里还有一个利用对抗学习改进目标检测结果的应用:

https://ift.tt/2kggAwh

https://ift.tt/2p6qD8m

Faster R-CNN

2015年,一个来自微软的团队(任少卿,何恺明,Ross Girshick和孙剑)发现了一种叫做"Faster R-CNN"的网络结构,基于区域建议网络进行实时目标检测,重复利用多个区域建议中相同的CNN结果,几乎把边框生成过程的运算量降为0。

你可以在这里看到关于Faster R-CNN的更多介绍,包括PPT和GitHub代码实现:

https://ift.tt/2aMqHnr

Matlab

https://ift.tt/1UQH5Xt

Caffe

https://ift.tt/1LHmLNq

MXNet

https://ift.tt/2s3VDbl

PyTorch

https://ift.tt/2AYwEMF

TensorFlow

https://ift.tt/2kO6wwj

Keras

https://ift.tt/2t0hNNn

C++

https://ift.tt/2tRe6tV

SPP-Net(空间金字塔池化网络)

SPP-Net是基于空间金字塔池化后的深度学习网络进行视觉识别。它和R-CNN的区别是,输入不需要放缩到指定大小,同时增加了一个空间金字塔池化层,每幅图片只需要提取一次特征。

相关资源:

https://ift.tt/1NSA54F

https://ift.tt/2GEot7w

更多论文:

DeepID-Net:基于变形深度卷积神经网络进行目标检测

https://ift.tt/2kee8Gl

深度感知卷积神经网络中的目标检测器

https://ift.tt/2s2RNPM

segDeepM:利用深度神经网络中的分割和语境进行目标检测

https://ift.tt/2keeehb

基于卷积特征激活图的目标检测网络

https://ift.tt/2b5C7m6

利用贝叶斯优化与结构化预测改进基于深度卷积神经网络的目标检测

https://ift.tt/1PYTPp9

DeepBox:利用卷积网络学习目标特性

https://ift.tt/1Isj1mQ

YOLO模型

YOLO是指标准化、实时的目标检测。

可以先看大数据文摘翻译的这个视频了解YOLO:

TED演讲 | 计算机是怎样快速看懂图片的:比R-CNN快1000倍的YOLO算法

有了YOLO,不需要一张图像看一千次,来产生检测结果,你只需要看一次,这就是我们为什么把它叫"YOLO"物体探测方法(You only look once)。

代码实现:

https://ift.tt/22oYiHP

https://ift.tt/2aMsTei

https://ift.tt/2aMrlkx

https://ift.tt/2b8nfqs

https://ift.tt/2kehbhV

相关应用:

Darkflow:将darknet转换到tesorflow平台。加载训练好的权值,用tensorflow再次训练,再将导出计算图到C++环境中。

https://ift.tt/2iIdimO

使用你自己的数据训练YOLO模型。利用分类标签和自定义的数据进行训练,darknet支持Linux / Windows系统。

https://ift.tt/2IF43RL

IOS上的YOLO实战:CoreML vs MPSNNGraph,用CoreML和新版MPSNNGraph的API实现小型YOLO。

https://ift.tt/2rSgUri

安卓上基于TensorFlow框架运行YOLO模型实现实时目标检测。

https://ift.tt/2julFPM

YOLOv2模型

时隔一年,YOLO作者放出了v2版本,称为YOLO9000,并直言它"更快、更高、更强"。YOLO v2的主要改进是提高召回率和定位能力。

各种实现:

Keras

https://ift.tt/2kuQVNK

PyTorch

https://ift.tt/2mME1jd

Tensorflow

https://ift.tt/2tBeVFs

Windows

https://ift.tt/2i7CeT1

Caffe

https://ift.tt/2GC4HcJ

相关应用:

Darknet_scripts是深度学习框架中YOLO模型中darknet的辅助脚本,生成YOLO模型中的参数anchors。

https://ift.tt/2IAGEkd

Yolo_mark:图形化标记用于训练YOLOv2模型的图像目标

https://ift.tt/2kqtCqc

LightNet:改进的DarkNet

https://ift.tt/2zc27tk

用于生成YOLOv2模型所需训练数据的边界框标记工具

https://ift.tt/2G43oUM

Loss Rank Mining:基于实时目标检测的一种通用的困难样本挖掘方法。LRM是第一个高度适用于YOLOv2模型中的困难样本挖掘策略,它让YOLOv2模型能够更好的应用到对实时与准确率要求较高的场景中。

https://ift.tt/2kfTbLu

YOLOv3模型

再次改进YOLO模型。提供多尺度预测和更好的基础分类网络。相关实现:

https://ift.tt/2mvghgY

https://ift.tt/22oYiHP

https://ift.tt/2keeM6J

https://ift.tt/2s3OGH6

SSD(单网络目标检测框架)

SSD可以说是YOLO和Faster R-Cnn两者的优势结合。相比于Faster R-Cnn,SSD的目标检测速度显著提高,精度也有一定提升;相比YOLO,速度接近,但精度更高。

相关实现:

https://ift.tt/2doLHTB

https://ift.tt/2tPIVfs

https://ift.tt/2keeRr3Tensorflow

https://ift.tt/2ntWjHg

https://ift.tt/2IysIXVMobileNet-SSD

DSOD(深度监督目标检测方法)

与SSD类似,是一个多尺度不需要proposal的检测框架,是一种完全脱离预训练模型的深度监督目标检测方法。

相关实现:

https://ift.tt/2uumjRJ

https://ift.tt/2vno3kc

https://ift.tt/2GEcw1xTensorflow

https://ift.tt/2IAGN7f

]]> 原文: https://ift.tt/2s48Cto
RSS Feed

机器知心

IFTTT

没有评论:

发表评论

马斯克的底裤要被扒光了!超级爆料一个多小时, xAI 工程师被火速解雇 -InfoQ每周精要No.910

「每周精要」 NO. 910 2026/01/24 头条 HEADLINE 马斯克的底裤要被扒光了!超级爆料一个多小时, xAI 工程师被火速解雇 精选 SELECTED 支付宝携手千问 App、淘宝闪购等发布 ACT 首个智能体商业信任协议发布。 Cowork ...