caffe数据集的自动划分

请问一下,关于caffe数据集划分问题。
 
我这边有个大数据集,类别及数量均比较多。如果使用手动划分测试集训练集,那么时间会耗费很久了。
请问一下能否使用python 实现在linux下,对各类数据集的等比例随机划分?
 
已邀请:
匿名用户

匿名用户

赞同来自:

可以考虑用skleran的
sklearn.model_selection.train_test_split
这个命令

freescar - Tracker

赞同来自:

Python写个循环,设个随机数,随机抽取你想要大小的测试集和验证集 remove到相应目录下。我也刚会用Python 想想百度 Python读文件名  递归移动文件  就可以了。 保证data 和 annotation 一起移动

要回复问题请先登录注册