你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
没有找到相关结果
陶潜水
赞同来自: caffe 、mhaoyang
LCWdesigner
赞同来自: alex68
赞同来自:
要回复问题请先登录或注册
机器视觉算法工程师 电子工程硕士
3 个回复
陶潜水
赞同来自: caffe 、mhaoyang
这种情况就不是直接使用分类网络了,如果想做端到端的目标检测网络,建议去看一看faster r-cnn、ssd、yolo这一类目标检测算法。
LCWdesigner
赞同来自: alex68
1.没必要把所有非汽车目标做成详细的多分类,如果你的图像上汽车的背景比较单一,那可以直接做成二分,0/1分类,0为背景上的非汽车目标,1为汽车。
2.你说的自动实现仅学习大图像上的指定目标的特征,这在训练模型上是不成立的吧,训练模型的时候你还是要制作只包含某一类图像的训练集,目前是没见过把一张大图丢进去然后实现学习某一块上的图像。
3.我之前做本科毕设的时候做过大图像上的目标检测,建议你参考一下人脸识别的一些例子,包括缩放、全卷积等策略,你这个可能用得上,当然这是后面的事情了。
陶潜水
赞同来自:
@mhaoyang:目标检测算法是基于深度学习来实现的,也是利用卷积网络提取抽象特征来进行目标检测,具体思想大部分算法是基于“区域建议框 分类器”。比如你要在图像上找到汽车,那就送入一张原始图像到卷积网络中,从而获得图像的特征图,然后利用RPN网络等方法在特征图上生成不同尺度、不同长宽比的框,这些框就是汽车目标的候选框,然后将框内的特征送入softmax分类器进行分类,判断是汽车还是背景(只要不是汽车就是背景),这就是识别过程,另外目标检测还会利用包围盒回归算法来对框的位置进行精修,确保框出更好的目标,特征图上的框的位置确定了,根据特征图和原始图像的比例,将框投影回原图就找到了汽车了。
如果对具体细节不清楚不能理解,强烈建议你看看我推荐的目标检测算法的论文,或者找找介绍这些算法的博客看一看,目标识别、目标检测、图像分割都是深度学习在视频图像领域的应用。
PS:如果你想在一幅图像上找到汽车,那你训练网络时的样本是大图,而不是只包含汽车的小图,建议下载个VOC数据集看看。