在Caffe中做人脸识别中是直接在人脸数据上训练好还是Fine-turning比较好?

请问各位大牛,做人脸识别任务,是在人脸数据库上直接训练比较好,还是用一些已有的模型做fine-turning比较好?
已邀请:
工业级的人脸识别算法已经流水线化,一般而言,流程如下:
1. 采集海量的人脸图像,例如WebFace数据集(包含10,575人,近50万张图像),训练初始的general人脸识别模型。可以完全随机初始化,也可以从imagenet上fine-tune, 以WebFace数据集为训练集,在LFW上测试,在imagenet上finetune的模型在实际中可观测到0.5%的性能提升。严格说,这并不具备统计上的显著性,但是可以认为imagenet的fine-tune是无害的。
 
2. Fine-tune的策略设计
我的师兄,李绍欣博士在博士论文中给了这样一张图:

图像迁移学习.jpg

 
最外端是随机图像,然后是自然图像,最后是人脸图像(WebFace->MultiPIE), 模型的训练过程可以理解为从随机图像(随机初始化)到ImageNet模型,再到一个分布更为general的人脸数据集(WebFace),最后到一个领域特定的人脸数据集。
在实践中,我一般建议有一个足够general的人脸模型,然后在领域特定的数据集上做finetune.

星空下的巫师 - https://github.com/shicai/Caffe_Manual

赞同来自: 辛淼 seallhf 阅微草堂 Quiet_cbo

如果有现成的比较好的基于人脸数据库训练出来的模型,可以采用Finetuning。
 
如果是ImageNet上的模型,考虑到人脸和ImageNet的差异太大,建议还是直接训练。
 
当然也有例外,比如Oxford VGG最近发的BMVC 2015论文,他们的工作通常都比较solid,而且模型也会开放,非常值得推荐。下载地址见:
http://www.robots.ox.ac.uk/~vgg/software/vgg_face/
 

disheng

赞同来自:

fine-tuning。

SuperStar

赞同来自:

各位大神麻烦顺便看看这个问题:http://caffecn.cn/?/question/1565

要回复问题请先登录注册