faster rcnn的特征图到原图区域映射问题?

在特征图上滑窗,把原图的候选区域和区域特征进行映射,映射关系是原图的候选区域除以所有步长的乘积? 但是我觉得跟核的大小也有关。谁能够帮算算。
已邀请:

王斌_ICT - 研究领域:深度学习,目标检测

赞同来自: ruirui_ICT 海之蓝 辛淼 王蒙蒙 OutLaws slaenig更多 »

本内容作者仅授权给CaffeCN社区(caffecn.cn)使用,如需转载请附上内容来源说明。R-CNN对目标进行检测实际上是先提取Region Proposal,然后对每个Region Proposal当成一张图进行特征提取和分类,这样对于一张图首先提取2k-3k个窗口,然后对每个窗口执行相同的操作是非常耗时的。SPP-NET的提出很好的解决了这个问题,我们只需要对测试图像提取一次特征,然后将原图Region Proposal所在位置映射到Feature Map相应区域即可,这样大大提高了检测效率。Fast R-CNN 结合SPP-NET的思路,设计了简化的SPP-NET——ROI层。具体的映射原理可以看下边图中的实例。
原图是605x1060的图像,其中一个region proposal为r1,这两个图是根据Fast R-CNN跑的结果,使用的是CaffeNet(所以最后Region Proposal全部映射成6x6的feature map),结合roi_pooling_layer.cpp源代码应该不难理解。
1-1.jpg

1-2.jpg

 

海之蓝

赞同来自: slaenig

谢谢王博的细心,但还有一点问题,spp-net和fast rcnn或者faster rcnn对输入的图片大小已经没有限制,但是网络结构还要resize成600*1000的大小。最后得到的conv5的大小都是一样的。spp就说这种的弊端,就加了spp金字塔图片模型。

鸡蛋打卤面 - 计算机视觉 深度学习

赞同来自:

请问这个16怎么来的?

wubaiqian - 一句话介绍

赞同来自:

请问bin-size 不应该是整数吗 ,可图中bin-h 和bin-w都是小数,是我理解错了?

jsjs0827 - 90后新手

赞同来自:

是多少?

南七骄傲 - 90后IT男

赞同来自:

roi映射原理这是我写的roi映射的文章,补充一下楼主的内容

要回复问题请先登录注册