最近看Yolo这篇论文,对文章中这句理解不是很清楚?

“如果一个物体的中心落入一个单元格,则该单元格上的B个矩形框的位置信息都为该物体的位置信息”该怎么理解呢?
原文是“If the center of an object falls into a grid cell, that grid cell is
responsible for detecting that object”!
在做测试的时候,我们并不知道目标的中心在哪里啊?求教,谢谢
已邀请:

uestc_yang - UESTC

赞同来自: xinmiao jschenxinpeng

yolo它是这样的,以7*7grid来说,你进行测试的时候是先进行每个grid中的bounding的置信度进行判断,如果判定为目标的后,然后获取相应的x,y,w,h的回归值,这里的x,y是相对于这个格子的位置,然后就可以获得你要的中心位置。推荐你看一下这个博客(caffe版本的yolo这个博客后面的代码是实现如何从1470中获取bounding  box并画框) http://blog.csdn.net/u01223527 ... 20152
有公开源码没?

s0302102 - 一句话介绍

赞同来自: coolwyj

测试的时候并不需要知道目标的中心在哪里。因为是用回归的训练方法,所以测试的时候,直接把特征与系数结合起来直接预测所有的框的位置以及类别跟置信度。

litingfeng

赞同来自: epleone

整个网络的输出是一个7*7*30的张量。7*7就是把图像分成7块,每一块需要预测的值是box相对于该块中心的偏移,以及相对长宽,类别。所以这样说

himon980

赞同来自:

不是有提前人工标注好的groud truth吗,

南七骄傲 - 90后IT男

赞同来自:

请问楼主他的代码跑起来了吗,我按照他主页上的代码运行会遇到
First section must be [net] or [network]

我输入的命令是
./darknet yolo test cfg/yolo-tiny.cfg yolo-tiny.cfg data/dog.jpg
这个报错,请问楼主遇到过吗?

bea_tree - 学习中

赞同来自:

这个应该是说每个网格的中心负责建立一个回归来预测object  吧 不对的地方请指教

攻城卒子 - 博观约取。

赞同来自:

讲真,我理解的是If the part of an object falls into a grid cell, that grid cell is responsible for detecting that object.尴尬,因为每个grid都会生成框啊

joshua_1988 - https://joshua19881228.github.io/

赞同来自:

我理解那句话是为训练说的,训练的结果就是每个grid的预测结果都是中心点落在其中的物体,在测试的时候并不需要知道物体的中心点在什么地方,是预测得来的

要回复问题请先登录注册