在faster rcnn 中,从图里随机获取的一个anchor (a mini-batch) 是如何对应RPN网络的输入(conv feature map)的?就是简单的几何关系吗?

已邀请:

王斌_ICT - 研究领域:深度学习,目标检测

赞同来自: caffe OutLaws

generate_anchor.m或者.py代码里对应着9种尺度的anchor产生。简单的可以将你问的对应关系分为两个部分:(1)首先按照尺度和长宽比生成9种anchor,这9个anchor的意思是conv5 feature map 3x3的滑窗对应原图区域的大小.这9个anchor对于任意输入的图像都是一样的,所以只需要计算一次. 既然大小对应关系有了,下一步就是中心点对应关系,接下来(2)对于每张输入图像,根据图像大小计算conv5 3x3滑窗对应原图的中心点.   有了中心点对应关系和大小对应关系,映射就显而易见了.

十点睡七点起

赞同来自:

我理解的是anchor就是输入了,label从这里计算得到!个人理解,有待考证,代码没看太明白

要回复问题请先登录注册