Caffe 测试网络中input_shape dim 与多尺度输入的问题

我知道类似下面测试网络的每个input_dim的意思,就是不太理解如果多尺度金字塔输入时,同一个图片区域resize成不同scale,再被输入进网络,网络是不是还会把它强制resize成12*12?那这样之前的多尺度放缩还有什么意义呢?
求各位指出我理解上的错误~
name: "PNet"
input: "data"
input_dim: 1
input_dim: 3
input_dim: 12
input_dim: 12
已邀请:

PangDeGui - 人脸、主动学习、职场新人

赞同来自:

你在跑mtcnn吗。。前面的是金字塔,是为了适应不同人脸大小,这里只是网络输入为12*12,也就是有可能这个12*12是个脸,有可能12*12只是原图上的一个眼睛,又或者12*12是整个原图

Uio96

赞同来自:

嗯谢谢,是在看mtcnn。。根据你的回答,我目前的理解是如果输入是一个很大的图像,网络会把它分成很多个12*12的小块,这么看对吗?另外我在网上找到了一个解析,感觉也像这个意思

要回复问题请先登录注册