基于py-faster-rcnn的obj-dec, 调整参数后收敛情况不好

基于py-faster-rcnn中end2end训练方法, 修改fc6以及fc7层的output_num, 原来为4096, 改为2048, 基于imagenet的zf.v2.caffemodel, 我的训练集共21类(包括background), 理论上来讲2048个output_num也是够的, 但是收敛情况不好, loss最终下降至1以上就没法下降了, 我迭代了大概10w次, 请问谁能解答一下为什么?
已邀请:

yazi1297

赞同来自: caffe

没人回答我自己来回答吧, 大致意思应该是这样, 不太清楚默认的权重初始化用的什么方式, 如果在修改了layer的name后, 等于这层是新加层, 各项权重都需要重新调整, 所以最好顶一个权重初始化方式, 就是weight_filler以及bias_filler, 我用的高斯, 大致就是这样吧. 具体理论不太懂, 我只是这么做出来了

要回复问题请先登录注册