image-processing - Gigatexel 等于 10 亿个字符，还是 10 亿个 float ？

我在看 NVIDIA's whitepaper on the GTX680 GPU .在第 6 页，白皮书提到 GTX680 的填充率为 128.8 千兆像素/秒。

我对此有几个问题:

一个纹素等于一个字节还是四个字节？换句话说，纹素是 RGBA(或浮点数)，还是只是一个字符？

“ 填充率 为 128.8 千兆像素/秒”是否与“ 带宽为 128.8 GB/秒”相同？

最佳答案

Gigatexels 是纹理单元吞吐量的度量。基本上它每秒能够处理 1288 亿个过滤纹理样本。

1)正如您所提到的，纹素的大小可能会有所不同。纹理通常是 RGBA 4 个字符(4 字节)、浮点数(4 字节)或 4 个浮点数(16 字节)。还有其他纹理格式，纹素是指纹理上一点的数据。

2) 不可以。以 GB/s 为单位的内存吞吐量定义了 GPU 从其主/全局内存“潜在”读取的速度。如果纹理样本不连贯(即不使用纹理的相同/相邻部分)，则将需要全局获取，并且与主存储器的带宽成为一个问题。这也适用于与 Gigatexel 图不同的任何数据，并且还包括顶点数据也是从内存中读取的事实。拥有高带宽至关重要，尤其是当有许多甚至数千个内核请求这些数据时。

关于image-processing - Gigatexel 等于 10 亿个字符，还是 10 亿个 float ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14496774/

上一篇：spring - 关闭程序的 DefaultMessageListenerContainer 问题

下一篇：visual-studio-2012 - Visual Studio Express 2012 for Web 中的 WCF 数据服务在哪里

相关文章：

python - 如何在图像中找到类似结构的表格

c# 获取不规则对象边缘坐标的替代快速方法？

arrays - CUDA 共享内存不比全局快？

java - 如何通过 ProcessBuilder 在 Java 中调用 CUDA C 应用程序？

c# - 将坐标转换卸载到 GPU

cuda - 多GPU基本使用

python - OpenCV中这个 'inverse map'函数有什么不准确之处？

image-processing - 图像分割 : how to isolate human body figure and a complex background?

c++ - 如何使用 thrust::lower_bound() 克服 VBO 索引计算期间的内存限制

sorting - 如何在 GPU 上对实例缓冲区进行排序？