有没有开放样本集的网络应用?

对深度学习来说,样本的质量很大程度上决定了网络的效果。
样本经常要进行,翻转,裁切,缩放,明暗度变化,增加噪声等数据增强处理。
而这些操作都需要由工程师来完成,有时还要进行样本清洗,把异常样本剔除出去,以及样本分布调整。
做样本也是一个经验和技术性很强的工作。
 
不过实际项目应用的时候,如果所有的样本工作都由工程师来做,也会涉及到一些问题。主要的一个是维护成本高,需要售后经常回访,采集识别异常的数据,差旅费用比较高;另外有些客户的数据不愿意公开,他们愿意自己进行维护。
 
关于如何把数据集开放给客户,大家是怎么做的。
把做样本的过程通过程序自动化就好了吗?
 
 
已邀请:

要回复问题请先登录注册