faster rcnn中rpn的训练

faster rcnn中的rpn在训练时,每个batch的输入是一张图像和随机从这张图像采样得到的256个anchors,faster rcnn的MATLAB版本和python版本中相关代码已经截图,其中python版本的输入只是256个anchors,

1482890535(1).jpg


1482890888(1).jpg


1482891060(1).jpg

 
我想问的是,一张图像在rpn经过前向计算后会得到多个anchors,而训练时输入是256个anchors,rpn的训练过程是怎么处理的?
已邀请:

lwslove911

赞同来自: 辛淼

认真看一下论文,论文中有提到的。一张1000*600的图片,经ZF网络经过前向传播,输出的feature map大约为60*40,在feature map上每个位置生成9个anchor,一张图片约20000(60*40*9)个anchors。忽略掉所有跨越图像边界的anchor,每张图片只剩下6000个anchor用于训练

hy17003

赞同来自:

请问一下你训练faster rcnn用了多少图像,多少类别?我训练出来框不住真正的目标

hy17003

赞同来自:

我训练几次faster rcnn都没成功,能否加我q 516918682,一起交流一下

要回复问题请先登录注册