用SSD的物体检测网络,它的label是怎么写入lmdb的

我自己写的Python代码把多通道数据转换为LMDB,但不明白它的label是怎么放得,是放XML文件吗?
分类的label只要把表示他的类别例如:0,1,2,。。。放到数组里就可以啦。
PS:不要说data和label生成两个lmdb
已邀请:

moothes

赞同来自: 宋姚姚

/src/caffe/util/io.cpp 里面的ReadRichImageToAnnotatedDatum函数应该就是你想要的东西

moothes

赞同来自: 宋姚姚

diff是指bbox是否为difficult,pascal voc数据集中每个bbox的一个属性,可以看label的xml

宋姚姚 - 桃子

赞同来自:

我看了caffe.proto文件,message AnnotatedDatum{optional Datum datum,​AnnotationType type, repeated AnnotationGroup annotation_group}结合io.cpp 里面的ReadRichImageToAnnotatedDatum函数,它应该是把数据放到了AnnotatedDatum的datum里,label放到了annotation_group,对吗?

宋姚姚 - 桃子

赞同来自:

谢谢你的解答奥,就是说,label放在num*8的矩阵里面,然后item_id代表第几张图片,group_label代表的是Bbox的类别,instance_id代表Bbox的个数,xmin,ymin,xmax,ymax代表四个坐标点,那diff代表的是什么呢?
 

宋姚姚 - 桃子

赞同来自:

那我只要把一张图片的所有Bbox按照annotated_data_layer.cpp里的label格式写下来,给annotation_group赋值就可以了吗?

moothes

赞同来自:

差不多这个意思吧,另外作者在annotated_data_layer.cpp里有一段注释说明了label的结构

要回复问题请先登录注册