训练样本取多少合适?

看各个典型模型都是几万个样本,
那问题来了,我训练自己的数据库,多少样本合适呢?几百个,几千个 还是几万个?
我觉得形态不是很复杂的物体分类,有几百个就够了。再多都是重复,也没什么用。
已邀请:

caffe - CaffeCN社区管理员公共账号

赞同来自:

看你问题的复杂度 以及样本之间的差异 原则上说 样本经过尽量覆盖到实际应用时的可能情况 测试与训练样本同分布 这是最好的。加样本也不是随便加,你加一万个重复的样本,不仅无益,而且有害,模型会完全过拟合到重复样本的情况,所以 增加样本的多样性更重要。

要回复问题请先登录注册