我刚开始使用 TensorFlows 对象检测 API,但我知道我需要将 csv 文件转换为 TFRecord。我理解csv的格式应该是8列,如下:
文件名、宽度、高度、类别、最小值、xmax、ymin、ymax
我困惑的是图像的哪个角被假定为原点?
感谢您的帮助!
最佳答案
假定图像的左上角为原点(0,0)
,宽度(x 坐标)随着您向右移动而增加并且高度(y 坐标)随着您向下移动而增加。
所以基本上,图像的右下角将被索引为 (width-1,height-1)
您上面描述的格式基本上是 Pascal VOC
注释格式,其中,对于特定的边界框
xmin
表示左上角的x坐标
ymin
表示左上角的y坐标
xmax
表示右下角的x坐标
ymax
表示右下角的y坐标
关于csv - TensorFlow 对象检测 API CSV 文件格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67268332/