c++ - opencv 的 reprojectImageTo3D() 中的深度图值

标签 c++ opencv camera-calibration stereo-3d

OpenCV 的 reprojectImageTo3D() 输出一个“表示 3D 表面的 3 channel 图像”。 您可以通过以下方式访问此数据

Vec3f coordinates = _3dImage.at<Vec3f>(y,x);
float depth = _3dImage.at<Vec3f>(y,x)[2];

witch 返回一个 vector [X,Y,Z]。

在 Gary Bradski 和 Adrian Kaehler 的“Learning OpenCV”中,解释了深度的计算方式

Z = f T/(x_left - x_right)

其中 f = 焦距,T = 眼底/相机之间的平移,(x_left - x_right) = 视差

这个确切的公式是在 OpenCV 中实现的(我检查了源代码 - 但是出于某种原因还有一个额外的负号)。问题是:指定的 X、Y、Z 值使用哪个单位?

T 以您的单位(例如毫米)为单位,x_l - x_r 以像素为单位,[ f ] = ?

当您校准相机时,您需要以现实世界的单位(例如毫米)指定棋盘的大小。因此,内在矩阵是否具有真实世界的单位?还是以px为单位指定?很遗憾,我无法在文档中找到答案。

最佳答案

执行深度重建的基本方程是:

Z = fB/d,其中

  • f 是焦距(以像素为单位),您将其称为眼底/相机之间的平移
  • B 是立体基线(以米为单位)
  • d 是视差(以像素为单位),衡量相应点之间视网膜位置的差异
  • Z 是沿相机 Z 轴的距离

图像点的 3D 位置 (X,Y,Z)(例如 (u,v) 以像素为单位)可以以米、厘米、毫米为单位给出或者您选择的任何内容,因为 3D 坐标 (X,Y,Z) 的单位与棋盘的正方形大小相同。例如,如果您将正方形大小定义为 1 厘米,则 3D 坐标也将以厘米为单位。

即:

Size boardSize(4, 5); // 4x5 chessboard
float squareSize = 0.025F; // 0.025 meters
for( int i = 0; i < boardSize.height; i++ )
    for( int j = 0; j < boardSize.width; j++ )
        corners.push_back(Point3f(float(j*squareSize), float(i*squareSize), 0.0F));

附:
Z 确定后,XY 可以使用通常的投影相机方程计算:

  • X = uZ/f
  • Y = vZ/f

关于c++ - opencv 的 reprojectImageTo3D() 中的深度图值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31802169/

相关文章:

c++ - 我有什么方法可以将 openCV 输出流式传输到我自己的远程 C++ gui?

opencv - 相机姿态估计(OpenCV PnP)

python - cv2 triangulatePoints 总是返回相同的 Z 值

opencv - 非平面钻机的相机标定

language-agnostic - 如何找到方形图案角的像素坐标?

c++ - 继承与类型转换

c++ - 是否可以对数组(一大块内存)使用按位运算

c++ - 从 OpenCV Mat 中删除列

c++ - 调整动态字符串数组的大小

c++ - Qt 窗口大小不正确,直到用户事件