image-processing - Gigatexel 等于 10 亿个字符,还是 10 亿个 float ?

标签 image-processing cuda gpu nvidia

我在看 NVIDIA's whitepaper on the GTX680 GPU .在第 6 页,白皮书提到 GTX680 的填充率为 128.8 千兆像素/秒。

我对此有几个问题:

  • 一个纹素等于一个字节还是四个字节?换句话说,纹素是 RGBA(或浮点数),还是只是一个字符?
  • 填充率 为 128.8 千兆像素/秒”是否与“ 带宽 为 128.8 GB/秒”相同?
  • 最佳答案

    Gigatexels 是纹理单元吞吐量的度量。基本上它每秒能够处理 1288 亿个过滤纹理样本。

    1)正如您所提到的,纹素的大小可能会有所不同。纹理通常是 RGBA 4 个字符(4 字节)、浮点数(4 字节)或 4 个浮点数(16 字节)。还有其他纹理格式,纹素是指纹理上一点的数据。

    2) 不可以。以 GB/s 为单位的内存吞吐量定义了 GPU 从其主/全局内存“潜在”读取的速度。如果纹理样本不连贯(即不使用纹理的相同/相邻部分),则将需要全局获取,并且与主存储器的带宽成为一个问题。这也适用于与 Gigatexel 图不同的任何数据,并且还包括顶点数据也是从内存中读取的事实。拥有高带宽至关重要,尤其是当有许多甚至数千个内核请求这些数据时。

    关于image-processing - Gigatexel 等于 10 亿个字符,还是 10 亿个 float ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14496774/

    相关文章:

    python - 如何在图像中找到类似结构的表格

    c# 获取不规则对象边缘坐标的替代快速方法?

    arrays - CUDA 共享内存不比全局快?

    java - 如何通过 ProcessBuilder 在 Java 中调用 CUDA C 应用程序?

    c# - 将坐标转换卸载到 GPU

    cuda - 多GPU基本使用

    python - OpenCV中这个 'inverse map'函数有什么不准确之处?

    image-processing - 图像分割 : how to isolate human body figure and a complex background?

    c++ - 如何使用 thrust::lower_bound() 克服 VBO 索引计算期间的内存限制

    sorting - 如何在 GPU 上对实例缓冲区进行排序?