c++ - 从相机获取每个像素的深度

标签 c++ opengl rendering vtk zbuffer

我有一个网格模型,并使用 VTK 从给定的相机位置 (x,y,z) 渲染了它的 View 。我可以将其保存为 RGB 图像 (640x480),但我还想保存深度图,其中每个像素都存储来自相机的深度值。

我曾尝试使用 Zbuffer渲染窗口通过以下 this example 给出的值.问题在于Zbufer仅存储 [0,1] 范围内的值。相反,我正在尝试创建合成范围图像,在其中存储每个像素距相机的深度/距离。类似于 Kinect 生成的图像,我试图从网格模型的特定视点创建一个。

编辑 - 添加一些代码

我目前的代码:

加载网格

string mesh_filename = "mesh.ply";
    vtkSmartPointer<vtkPLYReader> mesh_reader = read_mesh_ply(mesh_filename);

    vtkSmartPointer<vtkPolyDataMapper> mapper = vtkSmartPointer<vtkPolyDataMapper>::New();
    mapper->SetInputConnection(mesh_reader->GetOutputPort());

    vtkSmartPointer<vtkActor> actor = vtkSmartPointer<vtkActor>::New();
    actor->SetMapper(mapper);

    vtkSmartPointer<vtkRenderer> renderer =  vtkSmartPointer<vtkRenderer>::New();
    vtkSmartPointer<vtkRenderWindow> renderWindow = vtkSmartPointer<vtkRenderWindow>::New();
    renderWindow->AddRenderer(renderer);
    renderWindow->SetSize(640, 480);

    vtkSmartPointer<vtkRenderWindowInteractor> renderWindowInteractor = vtkSmartPointer<vtkRenderWindowInteractor>::New();
    renderWindowInteractor->SetRenderWindow(renderWindow);

    //Add the actors to the scene
    renderer->AddActor(actor);
    renderer->SetBackground(1, 1, 1);

创建一个相机并将其放置在某处
vtkSmartPointer<vtkCamera> camera = vtkSmartPointer<vtkCamera>::New();

    renderer->SetActiveCamera(camera);
    camera->SetPosition(0,0,650);
    //Render and interact
    renderWindow->Render();

从 z 缓冲区获取结果
double b = renderer->GetZ(320, 240);

在这个例子中,这给出了 0.999995。由于值介于 [0,1] 之间,我不知道如何解释这一点,正如您所看到的,我已将相机设置为在 z 轴上 650 个单位,因此我假设该像素处的 z 距离(即位于渲染 RGB 中的对象上)应该接近 650。

最佳答案

这个 python 片段说明了如何将 z 缓冲区值转换为实际距离。非线性映射定义如下:

numerator = 2.0 * z_near * z_far
denominator = z_far + z_near - (2.0 * z_buffer_data_numpy - 1.0) * (z_far - z_near)
depth_buffer_data_numpy = numerator / denominator
在这里,一个完整的例子:
import vtk
import numpy as np
from vtk.util import numpy_support
import matplotlib.pyplot as plt

vtk_renderer = vtk.vtkRenderer()
vtk_render_window = vtk.vtkRenderWindow()
vtk_render_window.AddRenderer(vtk_renderer)
vtk_render_window_interactor = vtk.vtkRenderWindowInteractor()
vtk_render_window_interactor.SetRenderWindow(vtk_render_window)
vtk_render_window_interactor.Initialize()

source = vtk.vtkCubeSource()
mapper = vtk.vtkPolyDataMapper()
mapper.SetInputConnection(source.GetOutputPort())
actor = vtk.vtkActor()
actor.SetMapper(mapper)
actor.RotateX(60.0)
actor.RotateY(-35.0)
vtk_renderer.AddActor(actor)

vtk_render_window.Render()
active_vtk_camera = vtk_renderer.GetActiveCamera()
z_near, z_far = active_vtk_camera.GetClippingRange()

z_buffer_data = vtk.vtkFloatArray()
width, height = vtk_render_window.GetSize()
vtk_render_window.GetZbufferData(
    0, 0, width - 1, height - 1, z_buffer_data)
z_buffer_data_numpy = numpy_support.vtk_to_numpy(z_buffer_data)
z_buffer_data_numpy = np.reshape(z_buffer_data_numpy, (-1, width))
z_buffer_data_numpy = np.flipud(z_buffer_data_numpy)  # flipping along the first axis (y)

numerator = 2.0 * z_near * z_far
denominator = z_far + z_near - (2.0 * z_buffer_data_numpy - 1.0) * (z_far - z_near)
depth_buffer_data_numpy = numerator / denominator
non_depth_data_value = np.nan
depth_buffer_data_numpy[z_buffer_data_numpy == 1.0] = non_depth_data_value

print(np.nanmin(depth_buffer_data_numpy))
print(np.nanmax(depth_buffer_data_numpy))

plt.imshow(np.asarray(depth_buffer_data_numpy))
plt.show()
边注:
在我的系统上,几次 imshow命令没有显示任何内容。重新运行脚本确实解决了这个问题。
资料来源:
http://web.archive.org
open3d

关于c++ - 从相机获取每个像素的深度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17659362/

相关文章:

c++ - Visual Studio C++ 将 CSV 文件中的数据输入变量数组

c++ - 是否有一个 vector 可以处理非标准位长的整数?

opengl - 即使变量只在顶点着色器上设置了三次,OpenGL 如何在片段着色器上插入变量?

three.js R71 - 移除环境,如何配置以获得相同的渲染结果?

javascript - 如何使 this.forceUpdate() 应用于 React Native 中的整个应用程序?

c++ - 使用预制命名空间 (C++) 的范围

c++ - QT中如何使QMenu Item可勾选

java - UV 和 ST 纹理坐标之间的差异

java - 将 P3D 对象放置在默认渲染器中

ruby-on-rails - Rails : Rendering Models?