Faster R-CNN ,Rcnn ,fast rcnn与caffe有什么关系呀?它主要是用来检测图像中的多个物体的吗?能否进行人脸比对?

在网上没有找到说的很具体的,,,看完后对原理还是不了解,比如 region proposals是什么意思?等
,如果有链接也可以给我发一个,谢谢了,
已邀请:
简要回答题目中的三个问题。
1. RCNN->Fast RCNN->Faster RCNN,是一个系列的具有递进关系的检测算法,目前最流行的实现都是基于Caffe这个框架的,也就是这些算法的开源Demo是基于Caffe做的。
2. 是的,可以检测多个物体。
3. 不可以进行人脸比对。
 
下面简单讲一下什么是Proposals。
在图像中检测一个物体,非常直观的想法就是选一个固定大小的框,从图像左上角滑窗到右下角,然后在每个框提取特征,对这个特征进行分类,判断是不是某个物体,如下图(网上找的,侵删):

 
如果选择的框的大小,跟目标物体真实大小不匹配,怎么办?那就要采用多个尺度的框,每个尺度都来这么一次,尽量匹配。这样的话,很多个尺度,比如十几个或者几十个尺度,每个尺度都要滑窗,会生成几万几十万甚至上百万的候选框,那计算量实在太大。
 
考虑到有物体的区域与背景区域在颜色、线条、纹理等方面具有较大的差异性,人们就提出一系列Proposal的方法,比如Selective Search方法,从图像中提取相对少量的,大概300-5000数量不等,大小不一的疑似物体的区域,作为候选框,然后进行特征提取和分类。这些候选框,就是Region Proposals。这些Proposals相对以前计算量小了很多,而且预先提取,在训练的时候可以反复利用,相对来说大大提高了训练速度。
 
概括来说,传统检测流程就是:提取Proposal,对Proposal进行特征提取,然后根据特征进行分类,最后做一些后处理合并检测框生成最后的检测目标位置和大小。在上述的基础上,可以结合下面知乎上对RCNN的讨论,进一步理解这个系列的检测算法。
附链接:https://www.zhihu.com/question/35887527
 

一品天下 - 找寻深度学习的乐趣

赞同来自:

说的很好,虽然思想简单,但是新手往往对这些基本的概念掌握不好,需要不断的积累经验才懂。

要回复问题请先登录注册