关于SSD,YOLO2等目标检测数据迁移的问题

SSD和yolo2 都需要在训练前将基础网络在imagenet上进行预训练,请问在imagenet上训练的时候图片的大小是多少?224*224吗?
如果我用224训练的基础网络,能用来训练SSD300或者yolo2 448吗?还是训练的时候图片的大小就必须和网络相对应?
已邀请:

陶潜水

赞同来自: alex68 c408550969

1、SSD和yolo2使用的基础网络模型是使用imagenet训练得到的,可以直接从诸如model zoo之类的地方直接下载得到,不用自己训练。
2、SSD使用了VGG作为预训练模型,VGG训练的输入时224*224,由于SSD不使用VGG的全连接层,而卷积层等其他网络层对输入图像尺寸没有限制,所以SSD使用300*300的样本训练没问题
3、yolo2认为如果用224*224训练基础网络会因为分辨率不高影响准确率,所以直接使用448*448的imagenet训练基础网络。
4、目标检测网络使用基础模型是用来提取特征的,所以只使用了模型的卷积层部分,不使用全连接层,全连接层对图像尺寸有限制,而卷积等其他网络层可以接受任意图像尺寸,所以训练SSD、YOLO2的样本不需要和基础网络的训练样本尺寸保持一致。
 

leoyang1987

赞同来自:

请问有做过batchsize的大小对最终训练效果的影响的测试吗? 理论上应该是batchsize越大,训练效越好。

要回复问题请先登录注册