应该怎么理解End to End 训练?

最近读目标检测的文章,发现大家都在说可以完成end2end的训练,比如faster-r-cnn。应该怎么理解这里的end2end呢?是一张图一张图的训练的意思吗?一张图当作一个mini-batch?因为一张图能抠出很多候选框,当成一个mini-batch倒不是问题,但是这样mini-batch的大小应该就不是固定的了,不知道我理解的对不对啊,求大神给个解释。
已邀请:

星空下的巫师 - https://github.com/shicai/Caffe_Manual

赞同来自: naisubing 佛仙魔 coolwyj

End to End训练是指从输入端到输出端整个流程都是可以学习的,所有步骤都是同时优化训练的。
R-CNN和Fast-RCNN的Proposal提取是用EdgeBox或者Selective Search。
R-CNN分类是还是用SVM的。
因此他们都不是End to End的。
Faster-RCNN的Proposal提取用的RPN,后面分类用Softmax,目标位置用回归,全部都在一个框架里,可以同时优化训练整个框架,所以是End to End。
 

要回复问题请先登录注册