网络能否做成只识别目标?---有一定难度

         当前神经网络做的是分类,也就是用大量分好类的样本对网络进行训练,使其掌握抽象特征,然后再进行识别(也就是分类),在某些情况下会遇到问题。比如我只要识别汽车,只要识别跟踪汽车,其他的都归纳为别的类。这样做一个跟踪器。怎么做呢?难道要把所有非汽车的目标都准备出来进行训练? 那得分多少类呢? 怎样修改网络,使之仅学习指定的目标的特征? 其他的任何不相关的都归为非目标。
 
         
已邀请:

陶潜水

赞同来自: caffe mhaoyang

你是要识别汽车还是检测汽车?根据你的描述是检测汽车然后跟踪吧...如果是检测就是只标出图像中的汽车作为样本,其他非汽车目标都不管。
这种情况就不是直接使用分类网络了,如果想做端到端的目标检测网络,建议去看一看faster r-cnn、ssd、yolo这一类目标检测算法。
 

LCWdesigner

赞同来自: alex68

以下纯属个人见解,有不对望指正:
1.没必要把所有非汽车目标做成详细的多分类,如果你的图像上汽车的背景比较单一,那可以直接做成二分,0/1分类,0为背景上的非汽车目标,1为汽车。
2.你说的自动实现仅学习大图像上的指定目标的特征,这在训练模型上是不成立的吧,训练模型的时候你还是要制作只包含某一类图像的训练集,目前是没见过把一张大图丢进去然后实现学习某一块上的图像。
3.我之前做本科毕设的时候做过大图像上的目标检测,建议你参考一下人脸识别的一些例子,包括缩放、全卷积等策略,你这个可能用得上,当然这是后面的事情了。

陶潜水

赞同来自:

一直提示我没有发表评论的权限...
@mhaoyang:目标检测算法是基于深度学习来实现的,也是利用卷积网络提取抽象特征来进行目标检测,具体思想大部分算法是基于“区域建议框 分类器”。比如你要在图像上找到汽车,那就送入一张原始图像到卷积网络中,从而获得图像的特征图,然后利用RPN网络等方法在特征图上生成不同尺度、不同长宽比的框,这些框就是汽车目标的候选框,然后将框内的特征送入softmax分类器进行分类,判断是汽车还是背景(只要不是汽车就是背景),这就是识别过程,另外目标检测还会利用包围盒回归算法来对框的位置进行精修,确保框出更好的目标,特征图上的框的位置确定了,根据特征图和原始图像的比例,将框投影回原图就找到了汽车了。
如果对具体细节不清楚不能理解,强烈建议你看看我推荐的目标检测算法的论文,或者找找介绍这些算法的博客看一看,目标识别、目标检测、图像分割都是深度学习在视频图像领域的应用。
PS:如果你想在一幅图像上找到汽车,那你训练网络时的样本是大图,而不是只包含汽车的小图,建议下载个VOC数据集看看。

要回复问题请先登录注册