csv - TensorFlow 对象检测 API CSV 文件格式

我刚开始使用 TensorFlows 对象检测 API，但我知道我需要将 csv 文件转换为 TFRecord。我理解csv的格式应该是8列，如下:

文件名、宽度、高度、类别、最小值、xmax、ymin、ymax

我困惑的是图像的哪个角被假定为原点？

感谢您的帮助!

最佳答案

假定图像的左上角为原点(0,0)，宽度(x 坐标)随着您向右移动而增加并且高度(y 坐标)随着您向下移动而增加。

所以基本上，图像的右下角将被索引为 (width-1,height-1)

您上面描述的格式基本上是 Pascal VOC 注释格式，其中，对于特定的边界框

xmin表示左上角的x坐标
ymin表示左上角的y坐标
xmax表示右下角的x坐标
ymax表示右下角的y坐标

关于csv - TensorFlow 对象检测 API CSV 文件格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67268332/