SSD的prior box(或者 faster-rcnn的anchor box)的作用是什么?

Smooth L1的公式如下:

1.jpg


2.jpg


4.jpg

那么根据公式, smooth L1(tx-tx*)=smooth L1(x-x*)/wa)
smooth L1(tw-tw*)= smooth L1(log(w/w*))
其余两个公式类似,感觉和prior box根本没有什么关系啊,x和y的回归完全可以用predict box 的宽和长去预测,根本用不着anchor box的宽和长。
在训练阶段看不出有什么用啊,然后预测阶段,SSD求predict box附近的满足条件的prior box,然后去做NMS,求得目标框(我目前这么理解,不知道有没有错),为什么我不直接拿predict box不就行了,为什么还要去做NMS?
已邀请:

joshua_1988 - https://joshua19881228.github.io/

赞同来自:

这个公式和prior box没有关系,但是predict box是由prior box和网络的输出相互作用算出来的,你可以理解为网络的输出要和prior box相互作用一下,才得到了那些带有*的值。
 
NMS是因为很多predict box框住的是同一个物体,这是因为prior box互相之间本来就有很大重叠,那么在训练的时候一些不同的prior box'会和同一个ground truth匹配上,这些框需要合并。

要回复问题请先登录注册